[B! 正規表現] moerrariのブックマーク

改行を含む正規表現について - OKWAVE

> sed＆awk・・・ > 　知り合いのLINUX使いが　良いから覚えろといいますが、Awkとか覚えるのがめんどくさそうで・・・ windowsで簡単に使えますか？ > おすすめサイトなどあったら教えてくださいまあ使いこなそうと思えば結構奥が深いですけど、ちょっとした置換をするくらいならそんなに覚えることはないですよ。でまあGUIみたいな飾りはありませんが gawk http://www.kt.rim.or.jp/~kbk/gawk-3.1 sed http://www.kt.rim.or.jp/~kbk/sed あとはvectorとか Download: Windows95/98/Me用ソフト > ユーティリティ > テキストファイル用 > AWK http://www.vector.co.jp/vpack/filearea/win95/util/text/awk/ 入門になりそ

moerrari 2017/09/30

「はじめ」と「おわり」に挟まれた部分だけを切り出したい場合sed -n -e "/はじめ/,/おわり/p"

正規表現

リンク

SimplyTerms - 正規表現

正　規　表　現正規表現とは、文字列のパターンを指定する方法です。翻訳者や編集者のように、文字の並びを加工する人にとって、強力でとても便利なツールになります。「整形・置換」タブで表示される機能は、みな、正規表現で実現されています。そのほとんどは、1行からせいぜい10行程度。これだけで、さまざまな機能を実現することができるのです。正規表現は、SimplyTermsだけでなく、秀丸などのエディタ、Word・一太郎などのワープロソフトでも使えます。それぞれに微妙な違いがありますが、一つ、覚えれば、他もかなり使えるようになります。簡単に使えるように、ヘルプにガイドをつけるとともに、SimplyTermsに正規表現ファイル作成ツールを組み込んであります。これを機会に、ぜひ、覚えてください。正規表現ファイルの注意点 SimplyTerms用に正規表現ファイルを作る場合、以下の点に注意してくださ

moerrari 2016/09/24

「よく使うパターン」で全角アルファベットや半角文字、漢字の指定方法が記載されている

正規表現

リンク

すべての漢字を取り出す正規表現 - totonのブログ

http://www.unixuser.org/~euske/doc/python/sample.py.html # 日本語トークンを切り出すための正規表現。 JP_TOKEN = re.compile(u"[一-龠]+|[ぁ-ん]+|[ァ-ヴ]+|[a-zA-Z0-9]+") http://www.ascii.co.jp/pb/ascii/archive/aftercare/1999.html ［亜-煕］はJIS漢字を検出するときに使う正規表現になります。本文中で触れている「一太郎 Lite2」の正規表現はUnicode仕様なので，すべての漢字を検出するには，[一-龠]を使用してください（龠は音読みで「ヤク」，訓読みで「ふえ」，Unicodeでは「9FA0」にあたります）。追記 ※「すべての漢字を取り出す正規表現」については、id:toton:20051105 に記事を追加しました。

moerrari 2016/04/11

Unicodeで全ての漢字は[一-龠](正しくはhttp://tama-san.com/kanji-regex/)

正規表現

リンク

sedは日暮れて：第3回正規表現地の巻 - Retroengine

moerrari 2016/04/02

正規表現

リンク

だるまのつぶやき---エクセルVBA小技集

最大公約数　―　２つの数値の最大公約数を返す関数 the greatest common divisor Sub CallTest() Debug.Print 最大公約数(24, 96) End Sub Function 最大公約数(ByVal M As Long, ByVal N As Long) As Long If M <= 0 Or N <= 0 Then Exit Function 'M>=Nに調整 If M < N Then Swap M, N Dim Q As Long, R As Long Do Q = M \ N R = M Mod N If R = 0 Then 最大公約数 = N Exit Function End If M = N N = R Loop End Function Private Sub Swap(A As Long, B As Long) Dim T

moerrari 2015/04/18

否定先読みは使えるのか？

リンク

正規表現（肯定先読み、否定先読み、肯定戻り読み、否定戻り読み） - satosystemsの日記

自分のためにメモ。 (肯定|否定)(先読み|戻り読み)、覚えづらい。正規表現パターン（boost::regex）説明肯定先読み (?=regex) regex に一致する文字列が始まる位置にある検索文字列と一致する。一致した文字列は記憶されず、後で使用することはできない。たとえば "Windows (?=95|98|NT|2000)" は、"Windows 2000" の "Windows" には一致するが、"Windows 3.1" の "Windows" には一致しない。先読み処理では、読み進まれた文字は処理済みとは見なされない。一致の検出後、次の検索処理は先読みされた文字列の後からではなく、一致文字列のすぐ後から開始される。否定先読み (?!regex) regex に一致しない文字列が始まる位置にある検索文字列と一致する。一致した文字列は記憶されず、後で使用することは

moerrari 2015/04/18

否定先読み "Windows (?!95|98|NT|2000)" は、"Windows 3.1" の "Windows" には一致するが、"Windows 2000" の "Windows" には一致しない。

正規表現

リンク

漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

Unicodeプロパティがサポートされない場合文字クラスで、文字が定義されているコードの範囲を指定します。このときShift_JISなどの[亜-熙]では不十分で、Unicodeブロックの範囲を指定する必要があります。ひらがな Hiragana (Unicode block) - Wikipedia 表記1 … [\u3041-\u3096] 表記2 … [\x{3041}-\x{3096}] カタカナ Katakana (Unicode block) - Wikipedia 表記1 … [\u30A1-\u30FA] 表記2 … [\x{30A1}-\x{30FA}] 表記1 … [々〇〻\u3400-\u9FFF\uF900-\uFAFF]|[\uD840-\uD87F][\uDC00-\uDFFF] 表記2 … [々〇〻\x{3400}-\x{9FFF}\x{F900}-\x{FA

moerrari 2014/07/19

正規表現

リンク

正規表現の概説

以下のページでは、正規表現についての一般的な使用方法について説明します。各トピックの内容はそれぞれ独立していますが、それまでに説明されている機能や概念を理解していることを前提に記述されています。したがって、トピックは順に読み進むことをお勧めします。「正規表現の概説」は次の各トピックで構成されています。正規表現正規表現の由来正規表現の用途正規表現の構文正規表現の作成優先順位通常文字特殊文字印刷できない文字文字の一致修飾子アンカー代替とグループ化後方参照

moerrari 2014/07/19

MSDNによる正規表現の解説。

正規表現

リンク

正規表現の構文

正規表現は、通常の文字 (a ～ z など) と、"メタキャラクタ" という特殊文字から構成される文字列のパターンです。パターンによって、テキスト本文を検索するときに一致する 1 つ以上の文字列を指定します。正規表現は、検索対象の文字列と文字パターンを一致させるためのテンプレートとして機能します。正規表現の例をいくつか次に示します。 JScript VBScript 一致結果

moerrari 2014/07/19

(?!pattern) pattern で指定しない文字列が続く場合に一致(否定先読み)

正規表現

リンク

VBAで正規表現を利用する（RegExp）｜VBA技術解説

公開日：2013-06-26　最終更新日：2021-06-02 VBAで正規表現を利用する（RegExp）正規表現は複雑なパターンマッチングとテキストの検索置換するためのツールです、マクロVBAで正規表現を使う場合はRegExpオブジェクトを使用します、 RegExpは、VBScriptに正規表現として用意されているオブジェクトです。

moerrari 2014/04/05

vbaで使える正規表現。一般的な正規表現と同じ。

リンク

AJAX Reguler EXpression eValuator

EnglishBulgarian

moerrari 2014/01/29

正規表現チェッカー

リンク

正規表現で文字列の否定

入力チェックなどでお世話になる正規表現ですが、これがなかなか奥が深い。複雑な正規表現は一体何をしているのか解析するだけでも一苦労。この前壁にぶつかったのが「ある特定の"文字列"を含まないようにチェックをかけたい」というもの。ある特定の１文字を含まないような正規表現は簡単ですが、文字列となると、これが結構難しい。たとえば「a」と「b」は含まれていていいけど、「ab」という文字列は駄目という場合。なんとなく ^[^(ab)]+$ でいけそうな気がするけど、これでは駄目。ちなみに正規表現を試したいときはここのサイトを利用すると便利。どれがマッチしたのかを視覚的に表示してくれるので、とってもわかりやすい。「ab」の文字列を否定する場合は「b」の前に「a」がないという記述をしないと駄目らしい。ここを参考に。実際の正規表現はこんな感じ。 ^(([^b]|[^a]b)|[^a]a)+$ ちな

moerrari 2014/01/29

前方参照否定位置指定子(?!hoge)が使えない場合は[^(hoge)]のように記述すればよい。opmlから旧まるごとRSSのURLにマッチしないRSSフィードを検索するには xmlUrl="http:\/\/[^(mrss)].*?"と書く。

正規表現

リンク

正規表現サンプル(正規表現Tips その２)

. 改行文字(\r,\n)以外のすべての文字に一致します。単体でも使えますが、数量子(*,+,?,{n},{n,},{n,m})と組み合わせて使うことが多いです。 .*は文字があるかまたは無限に続く、.+は文字が1文字以上無限に続く、.?は文字があるかまたは無い、.{5}は5文字の文字、.{2,}は2文字以上の文字、.{2,6}は2文字以上6文字以内の文字にそれぞれ一致します。 [ ] 文字クラスといい、[ ]内のいずれかの文字を表します。 [ABC]だとA,B,Cの何れか1文字です。[ ]内にはほぼなんでも組み合わせて指定できます。\d,\s,\wなども可能です。 -を使うと範囲を指定でき、[A-D]だとA,B,C,D、[0-5]だと0,1,2,3,4,5を表します。こちらも組み合わせて[A-D0-5]のように使えます。 [ ]に一致する文字は1文字のみです。よって数量子(*,

moerrari 2014/01/18

グルーピングの否定 abc(?!def) のように書く。拡張正規表現(Version8以降)対応。

正規表現

リンク

あなたが正規表現の中級者か判別する10問テスト　（文字列処理の必須知識） - 主に言語とシステム開発に関して

スキルチェックの目次へあなたが，正規表現を扱うプログラマーとして，中級以上の実力を持っているかどうか判定します。下記に，正規表現に関する１０問の質問があります。いずれも，「文字列を処理する実用的なプログラム」を書く上で必要な知識です。これから試験を行ないます。　空欄を埋めて下さい。５分以内に回答して下さい。 ※空欄は　＿＿＿＿＿　のように下線として示されています。（問１） "郵便番号は〒123-4567です。" という文字列を，str1 とします。 str1 の中に郵便番号が含まれているかどうかを判定したい場合は， /〒[0-9]{3}-[0-9]{4}/ という正規表現を記述します。一方，str1 の中から，郵便番号の数値の「123」と「4567」の部分を抽出したい場合は， /＿＿＿＿＿＿＿＿＿/g という正規表現を記述します。（問２）正規表現では，（１）のように，マッ

moerrari 2013/11/05

Perlレベルの正規表現についてはあまり知らなかった。勉強後ぜひ試験にチャレンジしたい。

正規表現

リンク

Emacs Lisp

正規表現は難しい。でも、Emacs Lisp の正規表現はもっと難しい。ここでは Emacs Lisp で正規表現を書くプログラマを混乱させる落とし穴についてまとめる。バックスラッシュ Perl では、バックスラッシュに合致する正規表現を次のように書く。 '\\' しかし、Emacs Lisp では以下のように書かなければならない。 "\\\\" Emacs Lisp の正規表現が嫌いになる理由はこれだけで十分だ。しかし、なぜこんなにもバックスラッシュが必要なのだろう？それは、Perl が「リテラル」として正規表現を記述するのに対し、 Emacs Lisp では「文字列」として表記するからである。 Emacs Lisp の関数呼び出しでは、各引数が「評価」されてから関数に利用される。もちろん、引数として与えられた文字列も利用前に評価される。 (message "a\tb")

moerrari 2013/01/13

emacsでの正規表現検索・置換で\nが受け付けられない件で検索していて見つける。

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

moerrari 2010/03/12

そういえばLPICは日本だけの資格ではなかったのだった。

リンク

「正規表現について（泣）」（1） Linux Square －＠IT

＠IT 会議室 Indexリンク Windows Server Insider Insider.NET System Insider XML & SOA Linux Square Master of IP Network Java Solution Security & Trust Database Expert RFID＋IC リッチクライアント & 帳票 Server ＆ Storage Coding Edge ＠ITクラブ Cafe VB業務アプリケーション開発研究＠IT SpecialPR

moerrari 2009/01/24

リンク

ブラウザで正規表現のチェックなどができるサイトまとめ | IDEA*IDEA

ドットインストール代表のライフハックブログ

moerrari 2008/12/05

正規表現

リンク

http://higashizm.sakura.ne.jp/reg/

moerrari 2008/10/09

*?は*の機能拡張版で、｢後に続く文字に最短でマッチ｣の意味になる

正規表現

リンク

正規表現の機能の覚書き

はじめに「はじめての正規表現」がホッテントリ入りしていますが、導入としては、何に使うのかがわかりやすくて良いのではないかと思います。あれを見て、基本機能をまとめてみたくなったので、正規表現の基本的な機能について書いてみます。（正規表現が初めてという人は「はじめての正規表現」を先に見たほうがいいと思います。）例では「検索」か「置換」をするものとして話を進めていきます。（「はじめての正規表現」が実例を中心にしたのに対して、こちらは機能を中心に書きます）正規表現は、プログラミング言語やその他のツールなど、それぞれで微妙な違い（方言）があるので、その点には注意が必要です。（表記法が違ったり、ここに紹介する機能がサポートされていなかったり、逆に紹介していない機能をサポートしていたりする場合があります）メタ文字とリテラル文字正規表現には、メタ文字とリテラル文字というものがあります。メ

moerrari 2008/09/23

先読み、否定先読み等Perlレベルの正規表現についても

リンク

はてなブックマーク

タグ

関連タグで絞り込む (11)

正規表現に関するmoerrariのブックマーク (28)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス