GASは「Google Apps Script」の略で、Googleのアプリを使って普段の業務を効率化したり、簡単なWebアプリケーションを作るためのスクリプト言語です。
GASを使えるようになることで、スプレッドシートのマクロ作成や、Webスクレイピング、カレンダーやGmailを連携させたアプリの開発などができるようになります。
正規表現とは、文字列内で文字の組み合わせを照合するために用いられるパターンです。
matchメソッド等、テキストデータの参照をする場合に多用されます。
文字列.match(/正規表現パターン/フラグ)
フラグは、検索時のオプション設定です。
g:マッチした全てを返す
i:大文字・小文字を区別しない
m:複数行を検索する
任意の0文字以上の文字列を表す正規表現
「名前:」:通常文字
「.」:任意の1文字を表すメタ文字
「*?」:直前の文字の0文字以上のうち最短のものを表すメタ文字
「r」:復帰
二つのメタ文字の組み合わせ「.*?」は任意の0文字以上の文字列のうち最短のものを表す。
特定のタグに囲まれた文字列 の指定方法
():グループ
[]:角括弧内のいずれかの1文字
\s:空白文字
\S:空白以外の文字
*:直前の文字が0文字以上
?:直前の文字が0文字または1文字以上
Webページのタイトル名をスクレイピングする場合の例
var myRegexp = /<title>([\s\S]*?)<\/title>/;
var title = source.match(myRegexp);
正規表現には、正規表現リテラルで表記する方法とRegExpオブジェクトを使う方法があり、上記は正規表現リテラルの例。
(スクレイピングで言うと、パーサーを使う方法もある。)
以下がわかりやすいので参考