タグ

正規表現に関するmoerrariのブックマーク (28)

  • 改行を含む正規表現について - OKWAVE

    > sed&awk・・・ >  知り合いのLINUX使いが 良いから覚えろといいますが、Awkとか覚えるのがめんどくさそうで・・・ windowsで簡単に使えますか? > おすすめサイトなどあったら教えてください まあ使いこなそうと思えば結構奥が深いですけど、ちょっとした置換をするくらいなら そんなに覚えることはないですよ。 でまあGUIみたいな飾りはありませんが gawk http://www.kt.rim.or.jp/~kbk/gawk-3.1 sed http://www.kt.rim.or.jp/~kbk/sed あとはvectorとか Download: Windows95/98/Me用ソフト > ユーティリティ > テキストファイル用 > AWK http://www.vector.co.jp/vpack/filearea/win95/util/text/awk/ 入門になりそ

    改行を含む正規表現について - OKWAVE
    moerrari
    moerrari 2017/09/30
    「はじめ」と「おわり」に挟まれた部分だけを切り出したい場合sed -n -e "/はじめ/,/おわり/p"
  • SimplyTerms - 正規表現

    正 規 表 現 正規表現とは、文字列のパターンを指定する方法です。翻訳者や編集者のように、文字の並びを加工する人にとって、強力でとても便利なツールになります。 「整形・置換」タブで表示される機能は、みな、正規表現で実現されています。そのほとんどは、1行からせいぜい10行程度。これだけで、さまざまな機能を実現することができるのです。 正規表現は、SimplyTermsだけでなく、秀丸などのエディタ、Word・一太郎などのワープロソフトでも使えます。それぞれに微妙な違いがありますが、一つ、覚えれば、他もかなり使えるようになります。 簡単に使えるように、ヘルプにガイドをつけるとともに、SimplyTermsに正規表現ファイル作成ツールを組み込んであります。これを機会に、ぜひ、覚えてください。 正規表現ファイルの注意点 SimplyTerms用に正規表現ファイルを作る場合、以下の点に注意してくださ

    moerrari
    moerrari 2016/09/24
    「よく使うパターン」で全角アルファベットや半角文字、漢字の指定方法が記載されている
  • すべての漢字を取り出す正規表現 - totonのブログ

    http://www.unixuser.org/~euske/doc/python/sample.py.html # 日語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html [亜-煕]はJIS漢字を検出するときに使う正規表現になります。 文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので,すべての漢字を検出するには,[一-龠]を使用してください(龠は音読みで「ヤク」,訓読みで「ふえ」,Unicodeでは「9FA0」にあたります)。 追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

    すべての漢字を取り出す正規表現 - totonのブログ
    moerrari
    moerrari 2016/04/11
    Unicodeで全ての漢字は[一-龠](正しくはhttp://tama-san.com/kanji-regex/)
  • sedは日暮れて:第3回 正規表現地の巻 - Retroengine

  • だるまのつぶやき---エクセルVBA小技集

    最大公約数 ― 2つの数値の最大公約数を返す関数 the greatest common divisor Sub CallTest() Debug.Print 最大公約数(24, 96) End Sub Function 最大公約数(ByVal M As Long, ByVal N As Long) As Long If M <= 0 Or N <= 0 Then Exit Function 'M>=Nに調整 If M < N Then Swap M, N Dim Q As Long, R As Long Do Q = M \ N R = M Mod N If R = 0 Then 最大公約数 = N Exit Function End If M = N N = R Loop End Function Private Sub Swap(A As Long, B As Long) Dim T

    moerrari
    moerrari 2015/04/18
    否定先読みは使えるのか?
  • 正規表現(肯定先読み、否定先読み、肯定戻り読み、否定戻り読み) - satosystemsの日記

    自分のためにメモ。 (肯定|否定)(先読み|戻り読み)、覚えづらい。 正規表現 パターン(boost::regex) 説明 肯定先読み (?=regex) regex に一致する文字列が始まる位置にある検索文字列と一致する。一致した文字列は記憶されず、後で使用することはできない。 たとえば "Windows (?=95|98|NT|2000)" は、"Windows 2000" の "Windows" には一致するが、"Windows 3.1" の "Windows" には一致しない。 先読み処理では、読み進まれた文字は処理済みとは見なされない。一致の検出後、次の検索処理は先読みされた文字列の後からではなく、一致文字列のすぐ後から開始される。 否定先読み (?!regex) regex に一致しない文字列が始まる位置にある検索文字列と一致する。一致した文字列は記憶されず、後で使用することは

    正規表現(肯定先読み、否定先読み、肯定戻り読み、否定戻り読み) - satosystemsの日記
    moerrari
    moerrari 2015/04/18
    否定先読み "Windows (?!95|98|NT|2000)" は、"Windows 3.1" の "Windows" には一致するが、"Windows 2000" の "Windows" には一致しない。
  • 漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

    Unicodeプロパティがサポートされない場合 文字クラスで、文字が定義されているコードの範囲を指定します。このときShift_JISなどの[亜-熙]では不十分で、Unicodeブロックの範囲を指定する必要があります。 ひらがな Hiragana (Unicode block) - Wikipedia 表記1 … [\u3041-\u3096] 表記2 … [\x{3041}-\x{3096}] カタカナ Katakana (Unicode block) - Wikipedia 表記1 … [\u30A1-\u30FA] 表記2 … [\x{30A1}-\x{30FA}] 表記1 … [々〇〻\u3400-\u9FFF\uF900-\uFAFF]|[\uD840-\uD87F][\uDC00-\uDFFF] 表記2 … [々〇〻\x{3400}-\x{9FFF}\x{F900}-\x{FA

  • 正規表現の概説

    以下のページでは、正規表現についての一般的な使用方法について説明します。 各トピックの内容はそれぞれ独立していますが、それまでに説明されている機能や概念を理解していることを前提に記述されています。したがって、トピックは順に読み進むことをお勧めします。 「正規表現の概説」は次の各トピックで構成されています。 正規表現 正規表現の由来 正規表現の用途 正規表現の構文 正規表現の作成 優先順位 通常文字 特殊文字 印刷できない文字 文字の一致 修飾子 アンカー 代替とグループ化 後方参照

    正規表現の概説
    moerrari
    moerrari 2014/07/19
    MSDNによる正規表現の解説。
  • 正規表現の構文

    正規表現は、通常の文字 (a ~ z など) と、"メタキャラクタ" という特殊文字から構成される文字列のパターンです。パターンによって、テキスト文を検索するときに一致する 1 つ以上の文字列を指定します。正規表現は、検索対象の文字列と文字パターンを一致させるためのテンプレートとして機能します。 正規表現の例をいくつか次に示します。 JScript VBScript 一致結果

    正規表現の構文
    moerrari
    moerrari 2014/07/19
    (?!pattern) pattern で指定しない文字列が続く場合に一致(否定先読み)
  • VBAで正規表現を利用する(RegExp)|VBA技術解説

    公開日:2013-06-26 最終更新日:2021-06-02 VBAで正規表現を利用する(RegExp) 正規表現は複雑なパターンマッチングとテキストの検索置換するためのツールです、 マクロVBAで正規表現を使う場合はRegExpオブジェクトを使用します、 RegExpは、VBScriptに正規表現として用意されているオブジェクトです。

    VBAで正規表現を利用する(RegExp)|VBA技術解説
    moerrari
    moerrari 2014/04/05
    vbaで使える正規表現。一般的な正規表現と同じ。
  • AJAX Reguler EXpression eValuator

    EnglishBulgarian

    moerrari
    moerrari 2014/01/29
    正規表現チェッカー
  • 正規表現で文字列の否定

    入力チェックなどでお世話になる正規表現ですが、これがなかなか奥が深い。複雑な正規表現は一体何をしているのか解析するだけでも一苦労。 この前壁にぶつかったのが 「ある特定の"文字列"を含まないようにチェックをかけたい」 というもの。ある特定の1文字を含まないような正規表現は簡単ですが、文字列となると、これが結構難しい。 たとえば「a」と「b」は含まれていていいけど、「ab」という文字列は駄目という場合。なんとなく ^[^(ab)]+$ でいけそうな気がするけど、これでは駄目。 ちなみに正規表現を試したいときはここのサイトを利用すると便利。どれがマッチしたのかを視覚的に表示してくれるので、とってもわかりやすい。 「ab」の文字列を否定する場合は「b」の前に「a」がないという記述をしないと駄目らしい。ここを参考に。実際の正規表現はこんな感じ。 ^(([^b]|[^a]b)|[^a]a)+$ ちな

    正規表現で文字列の否定
    moerrari
    moerrari 2014/01/29
    前方参照否定位置指定子(?!hoge)が使えない場合は[^(hoge)]のように記述すればよい。opmlから旧まるごとRSSのURLにマッチしないRSSフィードを検索するには xmlUrl="http:\/\/[^(mrss)].*?"と書く。
  • 正規表現サンプル(正規表現Tips その2)

    . 改行文字(\r,\n)以外のすべての文字に一致します。 単体でも使えますが、数量子(*,+,?,{n},{n,},{n,m})と組み合わせて使うことが多いです。 .*は文字があるかまたは無限に続く、.+は文字が1文字以上無限に続く、.?は文字があるかまたは無い、.{5}は5文字の文字、.{2,}は2文字以上の文字、.{2,6}は2文字以上6文字以内の文字にそれぞれ一致します。 [ ] 文字クラスといい、[ ]内のいずれかの文字を表します。 [ABC]だとA,B,Cの何れか1文字です。[ ]内にはほぼなんでも組み合わせて指定できます。\d,\s,\wなども可能です。 -を使うと範囲を指定でき、[A-D]だとA,B,C,D、[0-5]だと0,1,2,3,4,5を表します。こちらも組み合わせて[A-D0-5]のように使えます。 [ ]に一致する文字は1文字のみです。よって数量子(*,

    moerrari
    moerrari 2014/01/18
    グルーピングの否定 abc(?!def) のように書く。拡張正規表現(Version8以降)対応。
  • あなたが正規表現の中級者か判別する10問テスト (文字列処理の必須知識) - 主に言語とシステム開発に関して

    スキルチェックの目次へ あなたが,正規表現を扱うプログラマーとして,中級以上の実力を持っているかどうか判定します。 下記に,正規表現に関する10問の質問があります。 いずれも,「文字列を処理する実用的なプログラム」を書く上で必要な知識です。 これから試験を行ないます。 空欄を埋めて下さい。5分以内に回答して下さい。 ※空欄は _____ のように下線として示されています。 (問1) "郵便番号は〒123-4567です。" という文字列を,str1 とします。 str1 の中に郵便番号が含まれているかどうかを判定したい場合は, /〒[0-9]{3}-[0-9]{4}/ という正規表現を記述します。 一方,str1 の中から,郵便番号の数値の「123」と「4567」の部分を抽出したい場合は, /_________/g という正規表現を記述します。 (問2) 正規表現では,(1)のように, マッ

    あなたが正規表現の中級者か判別する10問テスト (文字列処理の必須知識) - 主に言語とシステム開発に関して
    moerrari
    moerrari 2013/11/05
    Perlレベルの正規表現についてはあまり知らなかった。勉強後ぜひ試験にチャレンジしたい。
  • Emacs Lisp

    正規表現は難しい。 でも、Emacs Lisp の正規表現はもっと難しい。 ここでは Emacs Lisp で正規表現を書くプログラマを混乱させる落とし穴についてまとめる。 バックスラッシュ Perl では、バックスラッシュに合致する正規表現を次のように書く。 '\\' しかし、Emacs Lisp では以下のように書かなければならない。 "\\\\" Emacs Lisp の正規表現が嫌いになる理由はこれだけで十分だ。 しかし、なぜこんなにもバックスラッシュが必要なのだろう? それは、Perl が「リテラル」として正規表現を記述するのに対し、 Emacs Lisp では「文字列」として表記するからである。 Emacs Lisp の関数呼び出しでは、 各引数が「評価」されてから関数に利用される。 もちろん、引数として与えられた文字列も利用前に評価される。 (message "a\tb")

    moerrari
    moerrari 2013/01/13
    emacsでの正規表現検索・置換で\nが受け付けられない件で検索していて見つける。
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
    moerrari
    moerrari 2010/03/12
    そういえばLPICは日本だけの資格ではなかったのだった。
  • 「正規表現について(泣)」(1) Linux Square - @IT

    IT 会議室 Indexリンク Windows Server Insider Insider.NET System Insider XML & SOA Linux Square Master of IP Network Java Solution Security & Trust Database Expert RFID+IC リッチクライアント & 帳票 Server & Storage Coding Edge @ITクラブ Cafe VB業務アプリケーション開発研究 @IT SpecialPR

  • ブラウザで正規表現のチェックなどができるサイトまとめ | IDEA*IDEA

    ドットインストール代表のライフハックブログ

    ブラウザで正規表現のチェックなどができるサイトまとめ | IDEA*IDEA
  • http://higashizm.sakura.ne.jp/reg/

    moerrari
    moerrari 2008/10/09
    *?は*の機能拡張版で、「後に続く文字に最短でマッチ」の意味になる
  • 正規表現の機能の覚書き

    はじめに「はじめての正規表現」がホッテントリ入りしていますが、 導入としては、何に使うのかがわかりやすくて良いのではないかと思います。 あれを見て、基機能をまとめてみたくなったので、正規表現の基的な機能について書いてみます。 (正規表現が初めてという人は「はじめての正規表現」を先に見たほうがいいと思います。) 例では「検索」か「置換」をするものとして話を進めていきます。 (「はじめての正規表現」が実例を中心にしたのに対して、こちらは機能を中心に書きます) 正規表現は、プログラミング言語やその他のツールなど、それぞれで微妙な違い(方言)があるので、その点には注意が必要です。 (表記法が違ったり、ここに紹介する機能がサポートされていなかったり、逆に紹介していない機能をサポートしていたりする場合があります) メタ文字とリテラル文字正規表現には、メタ文字とリテラル文字というものがあります。 メ

    正規表現の機能の覚書き
    moerrari
    moerrari 2008/09/23
    先読み、否定先読み等Perlレベルの正規表現についても