タグ

並列処理に関するfragarach_the_swordのブックマーク (5)

  • [第1回]今さら聞けないHadoopの基礎

    OSS(オープンソースソフトウエア)のミドルウエア、「Hadoop」が注目されている。大量のデータ、とりわけログ、テキスト、画像といった非構造化データを取り扱うための高速な情報処理基盤を安価に構築できるからだ。そこで連載ではHadoopを基礎から説明する。 連載は情報システム部門の企画担当者や利用部門のIT活用推進者などが対象。序盤ではHadoopの基やアーキテクチャーを解説。回を追って分散ファイルシステムの操作とMapReduce処理をコードで確認。ユースケースやクラスタ管理にも言及するほか、2012年に予定されている次期メジャーリリース0.23の情報などの最新トピックも取り込んでいく。 ニーズ高まる「ビッグデータ」の基盤 日にとって2011年は「ビッグデータ」元年だったと言ってよいのではないでしょうか。ビッグデータに関わる製品やソリューションが国内外のベンダーから発表となり、多

    [第1回]今さら聞けないHadoopの基礎
    fragarach_the_sword
    fragarach_the_sword 2012/09/08
    ITPro連載:基礎から解説!企業を変えるHadoop(1)今さら聞けないHadoopの基礎
  • キー分布が偏る場合は性能向上

    最後に12ノードの環境で、複数のHadoopジョブを実行した場合の処理性能について説明する。通常は、1台のサーバー上で複数の処理を同時に実行すると、リソースの競合が発生して性能が低下する。Hadoopで同様の問題が発生するのか調べた。 検証では、同一のHadoopクラスター上で同一処理内容のHadoopジョブを二つ動作させた。キャッシュの影響を排除するために、各ジョブは別のデータを処理するようにしている。 結果はキーの分布が一様な場合とべき分布の場合で異なった(図9)。

    キー分布が偏る場合は性能向上
    fragarach_the_sword
    fragarach_the_sword 2011/08/29
    ITPro連載:Hadoop――企業システムでの実力は?:検証(4)複数ジョブの同時実行:キー分布が偏る場合は性能向上
  • グーグル発「Hadoop」、日本企業も利用へ

    Hadoopは、グーグルが検索エンジン用に開発したバッチ処理システムを基に開発された、オープンソースソフトだ。グーグルが開発した分散ファイルシステム「Google File System(GFS)」を模した「Hadoop Distributed File System(HD FS)」と、データ処理機構「MapReduce」を模した「Hadoop MapReduce」で構成する。 米国では米VISAや米JPモルガン・チェースのような大手金融機関が、バッチ処理にHadoopを使用する。 そのHadoopがいよいよ、日企業でも使われ始めた。例えば楽天は、ある商品に対するお薦め商品をリストアップする「レコメンド処理」にHadoopを使用する。NTTデータは、全国の渋滞情報をリアルタイムに可視化するシステムの構築にHadoopを採用した。三菱UFJインフォメーションテクノロジーもHadoopを使っ

    グーグル発「Hadoop」、日本企業も利用へ
    fragarach_the_sword
    fragarach_the_sword 2011/02/05
    グーグル発「Hadoop」、日本企業も利用へ - 「情報爆発」を支えるテクノロジー:ITpro
  • Javaプログラムの網羅的検証を並列処理で高速化 : 富士通

    2010年12月17日 Fujitsu Laboratories of America, Inc. 株式会社富士通研究所 Fujitsu Laboratories of America Inc.(注1)と株式会社富士通研究所(注2)(以下、富士通研究所)は、Javaプログラムの網羅的検証を並列処理で高速に行う技術を開発しました。 ICTシステムの品質を確保するには、ソフトウェアであるプログラムを十分にテストすることが必要です。富士通研究所が開発したプログラムを網羅的に検証する技術に対して、今回開発した技術を適用することにより、クラウドの活用による検証時間の大幅な短縮が可能になり、プログラムの品質向上につながると期待されます。 プログラムの検証とは ビジネスの根幹を担うICTシステムの品質を確保するためには、システムの機能を提供するプログラムが想定通りに動作するかを十分にテストして検証しなけ

    fragarach_the_sword
    fragarach_the_sword 2011/01/13
    Javaプログラムの網羅的検証を並列処理で高速化 : 富士通
  • 処理並列は、必ず処理速度が向上するのか

    はじめに CPUは、コンピューターの頭脳です。単純に考えると、頭脳が2つあれば、1つの時と比べて、同じ時間でたくさんのことを考えることができそうです。10年ほど前、Intel製プロセッサーPentium IIの頃から、1枚のボードに複数のCPUを載せて高速化する試みがなされました。Intel製CPUでは2ユニットまででしたが、SUN Microsystems製のコンピューターでは、もっとたくさんのユニットを載せることができていました。今では、CPU自体に複数の「コア」を載せ、1ユニットで同時に別々のことを実行できるようになっています。 ハードウェアが、同時に複数のことを実行できるようになったため、ソフトウェアもそれに対応する必要が出てきました。記事では、昨今あちらこちらで声高に繰り返される、「並列処理化すれば速くなる」に疑問を持ったため、それを検証することにします。 対象読者 なんといっ

    処理並列は、必ず処理速度が向上するのか
    fragarach_the_sword
    fragarach_the_sword 2010/03/14
    処理並列は、必ず処理速度が向上するのか(1/5):CodeZine
  • 1