タグ

正規表現に関するlovecallのブックマーク (8)

  • 元の文字列を残す置換の出来るテキストエディターはあるでしょうか。 - たとえば、<B>なんたら</B><BR><B>かんたら</B><... - Yahoo!知恵袋

    元の文字列を残す置換の出来るテキストエディターはあるでしょうか。 たとえば、 <B>なんたら</B><BR> <B>かんたら</B><BR> などのパターンの文字列(指定の開始タグ・指定の終了タグに任意の文字列が挟まれている状態)を検索して、それぞれを <h2>なんたら</h2> <h2>かんたら</h2> という風に、タグの間の文字列は置換しないで元のままに残し、前後のタグだけ置換したいのです。 <B>.*</B><BR> で検索は出来ますが、「.*」の部分を特定の文字列に置換しないで、元のままに残すテキストエディターはあったら、エディター名を教えてください。

    元の文字列を残す置換の出来るテキストエディターはあるでしょうか。 - たとえば、<B>なんたら</B><BR><B>かんたら</B><... - Yahoo!知恵袋
  • すべて「ひらがな」かどうか調べる - [正規表現/PHP] ぺんたん info

    UTF-8 if(preg_match("/^[ぁ-ゞ]+$/u",$str)){ echo "ひらがなのみです"; }else{ echo "ひらがなのみではありません"; } UTF-8 コード表記 if(preg_match("/^(¥xe3¥x81[¥x81-¥xbf]|¥xe3¥x82[¥x80-¥x9e])+$/",$str)){ echo "ひらがなのみです"; }else{ echo "ひらがなのみではありません"; } UTFでは、修飾子『 u 』をつけないと、「む」を認識できないことがあります。 (修飾子『 i 』などをあわせてつけたとき) これ以外にも『ゔ、ゕ、ゖ』があります。 (小文字の『か』『け』。環境によっては表示できません。) EUC-JP if(preg_match("/^[ぁ-ん゛ゝゞ]+$/",$str)){ echo "ひらがなのみです"; }else

  • 投資対効果の極めて高い、プログラムなんて分からない人のための「単純作業自動化」入門 - R&D: りょうえんダイアリー

    あるいは、正規表現+置換による、プログラミングができなくても単純なテキスト編集作業を強力に自動化する方法 このTipsの概要 このTipsでは「テキストを、強力に自動的に操作する方法」が得られます。 自動化といっても、プログラミング言語に習熟するのは大変です。 そこで、プログラミングほど、習熟や利用に負荷が掛からず、かつ応用範囲が広い「正規表現」と言われる書式と、テキストエディタなどに付属の「置換」機能を組み合わせたものを解説します。 具体的にできるようになること たとえば「ネットから文章をテキストエディタにコピー&ペーストしたが、変な改行がたくさん入っているので、改行を手動で消す作業をたくさんしないと。」 とか 「ごはん、ご飯、御飯、ゴハン」と、いろんな書き方で書かれている「ごはん」を、全部「ご飯」という表記に統一したい とか 「Skypeからコピペしたら、発言者名がいっぱいついて、消す

    投資対効果の極めて高い、プログラムなんて分からない人のための「単純作業自動化」入門 - R&D: りょうえんダイアリー
  • ITキヲスク | コレだけ知れば十分捗る!「正規表現」たった2つのポイント

    長文テキストから必要な文字列を抜き出したり、HTMLソースから欲しいトコを抽出したりしたい時、役に立つのが「正規表現」。 使えるようになるとメチャクチャ便利なんですが、記号の羅列っぷりに気押されして、初めはなかなか手をつけられないんですよねー。 自分自身まだまだヒヨッコではありますが、それでも「たったコレだけ知ってるだけでも、効率がガクンと上がったよ!」という正規表現について、ご紹介しちゃおーと思います。 サンプルは基的にPHPのモノですが、内容はPerlでもテキストエディタの検索/置換機能でもおおよそ同じかと思いますので、そこら辺は各自で適宜読み替えつつ、ご覧になって下さいまし☆ 「正規表現」2つのポイント 題の前に(正規表現とpreg_replace関数・preg_match関数について) 正規表現自体イマイチ良く分からんって方のためにカンタンに説明すると、正規表現とは「あらかじめ

    ITキヲスク | コレだけ知れば十分捗る!「正規表現」たった2つのポイント
  • うざい日本語ハッシュタグをタイムライン上から消し去る方法 : さざなみ壊変

    7月13日からTwitterで使えるようになった日語ハッシュタグ。 質問をいろんな人に回す、いわゆる「バトン」みたいなのが昔からちょっと苦手で、日語ハッシュタグも似たような使い方をされることが多いようなので、日語ハッシュタグの発言をなんとか隔離できないかと悩んでいました。 コミケが終わって一息ついていたところ、Twitter用のクライアントTweenを使ってやる方法に気がついたので以下に記します。 日語ハッシュタグを隔離する Tweenの「メニュー」→「タブ」→「タブ作成」で隔離用のタブを作成。タブの種類は「タイムライン振り分け」。 できたタブを右クリックして「振り分けルール編集」。 1.「新規」をクリック。 2.マッチルールで複合条件の発言内容に#[ぁ-ヶ]と入力。 3.正規表現にチェックを入れる。 4.マッチ時の追加動作で「Recentから移動する」にチェックを入れる。 5.「

    うざい日本語ハッシュタグをタイムライン上から消し去る方法 : さざなみ壊変
    lovecall
    lovecall 2011/08/22
    正規表現でタブ振り分け for Tween. / 嫌なら見ないの自衛法
  • 【正規表現01】日付の表現 - 名もないテクノ手

    はじめに 正規表現が便利だとわかっていても、思い通りに使いこなすのはなかなか難しいと感じる方も大勢いらっしゃると思います。難しいメタ文字を覚えるのが正規表現ではありません。検索をモデル化する「考え方」がもっとも重要です。簡単な表現からひとつひとつ学んで行けば、少しづつ使えるようにるでしょう。いくつかのメタ文字を暗記してみたけれど「実際に」どう使えばいいのか(正しいのかどうか)迷っている方は参考にしてみてください。 これからたまに(気が向いた時に)「正規表現のワンポイントレッスン」を取り上げていきます。なにかしら具体的な実例を上げて、その解法を考えてみます。よかったら、みなさんも考えてみませんか? 解法を思いついたら、気軽にコメントを付けてみてください。解答は翌日(または数日後)エントリーに追記します。 このブログの読者はDTPユーザーが多いですから、正規表現の検証や図示にはAdobe In

    【正規表現01】日付の表現 - 名もないテクノ手
  • 「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ : 404 Blog Not Found

    2009年03月19日18:00 カテゴリLightweight Languages 「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ ああ、まただよ... かなり使えるPHPの正規表現まとめ - IDEA*IDEA 〜 百式管理人のライフハックブログ 〜 正規表現って、プログラミング言語間の差が少ないサブ言語なのに、なぜ「PHP」がつくとダメ正規表現ばかり登場するのか。うんざりだ。 かなり使えるPHPの正規表現まとめ - IDEA*IDEA 〜 百式管理人のライフハックブログ 〜メールアドレスは厳密にチェックしようとするとなかなか難しいのですが、簡単なチェックだったらこれでOKぽいですね。 /^[^0-9][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[@][a-zA-Z0-9_]+([.][a-zA-Z0-9_]+)*[.][a-zA-Z]{2,4}$

    「PHP使いはもう正規表現をblogに書くな」と言わせないでくれ : 404 Blog Not Found
  • ドコモもauはとりあえず"da..me."@を受け取れるようにしとくべし : 404 Blog Not Found

    2007年11月20日12:00 カテゴリiTech ドコモもauはとりあえず"da..me."@を受け取れるようにしとくべし けだし同感なのだけど、これでもメアドを再設定しない人をどうするかという問題は残る。 ドコモもauもいいかげんにメールアドレス設定の仕様を直せ。 とりあえずドコモの携帯で確認したが、2007年11月現在のいまも、***.@docomo.ne.jpとか**....***@docomo.ne.jpといったメールアドレスの設定/取得は可能なままである。 というわけで、解決策を考えてみた。 実はRFC2822の規定では、da.me..@docomo.ne.jpというメールアドレスはNGだが、意外なことに"da.me.."@docomo.ne.jpであればOKなのだ。@の前の部分が""でくくられている場合、RFC2822はそれを特別扱いすることになっているので、こんなトリック

    ドコモもauはとりあえず"da..me."@を受け取れるようにしとくべし : 404 Blog Not Found
  • 1