[情報システム]4-5 正規表現

2024.12.9修正
  • テキストデータは、主にテキストエディターで操作するが、大量のテキストに対し、同様の処理を自動的に行うため、sed、awk、perl、rubyなどのスクリプト言語を利用し、処理内容を記述してスクリプトを実行する。

  • Perlなどテキスト処理に向いている言語では、目的とするテキスト内の文字列を特定する「正規表現」を使用することで作業効率の向上が期待できる。

  • フィルター言語は、ファイル中の文字列を端から読み、正規表現によって記述された条件に合う文字列を特定し、一括自動変換を行う。

  • Perlは多くのプラットフォームで用いられており、他のスクリプトと連係し、アプリケーションのデータを書き出し、正規表現による置換処理などを行い、元のアプリケーションに戻すことも可能である。この機能は、データベースに蓄積されたデータを印刷用のデータとして変換するときなどに使用できる。