タグ

architectureとapacheに関するfragarach_the_swordのブックマーク (3)

  • Cassandra実践入門―Twitter、Facebookが採用するNoSQLシステム | gihyo.jp

    はじめに 2010年のはじめ、TwitterがApache CassandraというJavaで実装された分散型のデータストアシステムを採用しつつあるというニュースが話題を呼びました。このことでCassandraは、NoSQLと呼ばれるシステムの中で最も注目を集めるものの一つになったと言えるでしょう。 2010年7月の時点で、Twitterは、位置情報のデータストレージ、トップツイート(トップページに表示される人気ツイート一覧)などのリアルタイム分析、データマイニング処理など、多くの用途でCassandraを活用しています。また、Cassandraを生み出し、のちにApache Foundationに寄贈したFacebookでは、5億人規模・150Tバイト以上のデータ量を持つユーザメッセージの検索機能(Inbox Search)を、150ノードのCassandraクラスタで処理しています。

    Cassandra実践入門―Twitter、Facebookが採用するNoSQLシステム | gihyo.jp
    fragarach_the_sword
    fragarach_the_sword 2013/07/10
    Cassandra実践入門―Twitter,Facebookが採用するNoSQLシステム
  • [4]機械学習におけるApache Mahoutの可能性と課題

    第2回、第3回では、音声データと、画像データに関するメディア認識技術について解説してきました。今回は、メディア認識技術に共通する課題である、機械学習の高速化について取り上げます。 まず、機械学習とは何かということから簡単に説明すると、ある程度大量のデータの中から規則性やパターンを見いだすことで、データの認識や判定などに役立てる取り組みのことを指します。例えば、皆さんが使用しているパソコンや情報システムの多くには、メールを受信したときに、ウイルスが含まれていないかどうか、スパムメールでないかどうか、判定するソフトウエアが入っていると思います。これも、過去の大量データに基づいて、ウイルスが入っていたり、スパムメールだったりする可能性が高いパターンを機械学習することで判定の仕組みを作り、そのロジックを活用しているのです。 そしてメディア処理システムには、音声、画像、テキストなどデータの種類を問わ

    [4]機械学習におけるApache Mahoutの可能性と課題
    fragarach_the_sword
    fragarach_the_sword 2012/11/02
    ITPro連載:非構造化ビッグデータの処理技術(4)機械学習におけるApache Mahoutの可能性と課題
  • オープンソースApache Tuscanyで楽しむSOA 第1回「Apache Tuscanyの紹介」

    はじめに この連載では、「オープンソースApache Tuscanyで楽しむSOA」として、オープンソースのSCA準拠製品である「Apache Tuscany」を取り上げ、SOA(サービス指向アーキテクチャ)の開発について説明していきたいと思います。第1回目の今回は、Tuscanyの誕生までの歴史と、Tuscanyとは何かを紹介していきます。 「楽しむ」という言葉に反応された方も多いでしょう。「SOAって楽しめるわけがない」「Webサービスの膨大な仕様書があるけどよくわからなかった」「簡単なことをやる割には、SOAPとかWSDLとか結構面倒だし」という声が聞こえてきそうです。そこなんです、当連載の目的は。Tuscanyは膨大なWebサービスの仕様書を読まなくても開発できます。Webサービスの面倒な部分はコンテナが勝手にやってくれます。JSONやATOMを使ったAjaxについてもほとんど知識

    オープンソースApache Tuscanyで楽しむSOA 第1回「Apache Tuscanyの紹介」
    fragarach_the_sword
    fragarach_the_sword 2009/09/16
    オープンソースApache Tuscanyで楽しむSOA 第1回「Apache Tuscanyの紹介」(1/3):CodeZine
  • 1