タグ

graphに関するsh19910711のブックマーク (226)

  • 書籍「グラフ深層学習」を参考にGNNのグラフ埋め込みをやってみた - Qiita

    記事の概要 GNNのグラフ埋め込みをpythonでの実装も含めてやってみたよ GNN のライブラリは使わずにやったよ 書籍「グラフ深層学習」の4章を参考にしているよ 簡単な理論とコードを載せているよ 僕と同じくGNNビギナーの方の参考になればうれしいよ モチベーション グラフニューラルネットワーク(GNN)について耳にする機会が増えたこと、また今年に入って書籍が続けて発行されたことから、GNN勉強してみたい!という人が増えているのではないでしょうか。 わたしもその一人で、独学ですが「グラフ深層学習(2023, ヤオ マー &ジリアン タン)」を読み進めています。 「グラフ深層学習」はグラフ理論の紹介から始まり、4章でグラフの特徴を抽出する グラフ埋め込み を取り上げています。 LLMなどでも使われる「埋め込み(embedding)」ですが、グラフにおいても特徴抽出の手法(教師なし学習)と

    書籍「グラフ深層学習」を参考にGNNのグラフ埋め込みをやってみた - Qiita
    sh19910711
    sh19910711 2024/05/27
    "「グラフ深層学習」の4章を参考 / タスクに応じた有用なベクトル表現を得ることが重要 / 元のグラフの情報をできるだけ保存する + その後のタスクで使用したい情報をなるべく保存できる写像が良い"
  • 【論文解説】Enhanced Multi-Relationships Integration Graph Convolutional Network for Inferring Substitutable and Complementary Items - Qiita

    【論文解説】Enhanced Multi-Relationships Integration Graph Convolutional Network for Inferring Substitutable and Complementary ItemsMachineLearningDNNRecommendation論文読みGNN はじめに 出典: AAAI 2023 Enhanced Multi-Relationships Integration Graph Convolutional Network for Inferring Substitutable and Complementary Items という、AAAIに提出された論文を紹介します。 この論文は中国のMeituan Maicaiと呼ばれるオンラインスーパーマーケットの研究者が取り組んだ、商品推薦の論文です。 論文を選んだ動

    【論文解説】Enhanced Multi-Relationships Integration Graph Convolutional Network for Inferring Substitutable and Complementary Items - Qiita
    sh19910711
    sh19910711 2024/05/21
    "E-Commerceサイトの推薦: ユーザーが見ている商品の代替商品だけでなく一緒に買われる補完商品の推定も重要 / 関係の強さも考慮したtriplet loss + 代替商品と補完商品それぞれの埋め込みベクトルを交差" doi:10.1609/aaai.v37i4.25532
  • グラフ信号処理におけるサンプリングと復元 - 甲斐性なしのブログ

    はじめに グラフ信号処理に関する日語の書籍が昨年発売された。 グラフ信号処理の基礎と応用: ネットワーク上データのフーリエ変換,フィルタリング,学習 (次世代信号情報処理シリーズ 5) 作者:田中 雄一コロナ社Amazon 記事ではその中で解説されているグラフ信号のサンプリングと部分空間情報を利用した復元について簡単にまとめた上で、実際に試てみた際のコードと結果を紹介する。 グラフ信号処理の諸概念 グラフ信号 グラフ信号は下図のようにグラフの各頂点上に値を持つ信号である。 このような頂点上に値を持つグラフの例としては、空間上に配置された複数のセンサーが挙げられる。これは、近くにあるセンサー同士が辺でつなげば、その計測値はグラフ信号とみなせる。それ以外にも、路線図と各駅の人口、SNSのつながりと各ユーザの特性(年齢などの何らかの数値)等々、グラフ信号としてモデル化できる現実の事象は様々存

    グラフ信号処理におけるサンプリングと復元 - 甲斐性なしのブログ
    sh19910711
    sh19910711 2024/05/13
    "グラフ信号としてモデル化できる現実の事象は様々 + 時系列信号や画像も時刻、画素を頂点とし近傍を辺でつなげばある種のグラフとみなせる / 「グラフ信号処理の基礎と応用: ネットワーク上データのフーリエ変換 ~ 」"
  • グラフデータの分析と DSOC の取り組みを俯瞰する / Overview of graph data analysis and DSOC initiatives

    sh19910711
    sh19910711 2024/05/09
    "GNN: skipgramの作り方、何を再構成するか、どの空間で畳み込むのかなどで個性 / スポーツのレーティングを転用した企業・業界ごとの特性の把握 + 企業がどの程度競合しているか + 転職ネットワークの埋め込みを活用" 2020
  • ElasticsearchとNeo4jをKafkaで連携する - Qiita

    どうしてこの記事を書いたのか Elasticsearch/Neo4j 活用していらっしゃいますでしょうか? どちらも著名なデータベース(DB)ですが,その特徴・用途は異なります. Elasticsearch は文字情報の検索に強く,Neo4j は関連性を早く調べたいという場合に利用されているイメージです. 所感ですが,Neo4j でもデータのプロパティを基準にクエリをかけたいこともありますし,Elasticsearch に入っているデータ同士を紐づけたいことも往々にしてあります. しかし,愚直にそうしてしまうとスループットが低くなったり,実装に継続的な作りこみが必要だったり,なかなか考え物です. そこで,データ構造を見直しつつ何とか良いとこ取りできないかなと検討するようになりました. Neo4j と Elasticsearch の連携を行うことで, Elasticsearchに投入したデー

    ElasticsearchとNeo4jをKafkaで連携する - Qiita
    sh19910711
    sh19910711 2024/05/09
    "Neo4j でもデータのプロパティを基準にクエリをかけたい + Elasticsearch に入っているデータ同士を紐づけたい / Neo4j Connector は Sink と Source のどちらもサポート" 2022
  • Google+で実感したコミュニケーションの非対称性 - きしだのHatena

    Google+は片思いの関係が手軽に可能ということで、非対称ネットワークだといわれる。 ただ、片思いが可能というのはTwitterもそうなっている。Google+のほうが片思いが気になりにくいとはいうものの。 それよりも、Google+にある非対称として、困ったものがあることに気づいた。それは、サークルのそこに流れるストリームの関係だ。 まずひとつとして、こちらがあちらを入れてるのと同じ種類のサークルに、あちらはこちらを入れてないという問題があげられる。 たとえば、ぼくが尊敬する技術者がいるとして、その人を「技術」サークルに入れる。そして、ある日、その技術者の人にお会いすることができるわけだが、その場はビールのイベントだったとする。そこでビールの話題でもりあがり後日、向こうは「ビール」サークルにぼくを入れてくれたとする。 その尊敬する技術者は、マニアックすぎる技術的な話は、その人の「技術

    Google+で実感したコミュニケーションの非対称性 - きしだのHatena
    sh19910711
    sh19910711 2024/05/05
    "どのサークルも、サークルのテーマにあった共有が少しと、あとは食べ物と一発ネタの動画とイヌネコの画像、話題のニュースだらけになっていく / なにを共有するか試行錯誤した結果そうなってる" 2011
  • QiitaのGNNタグ付けレコメンドにテキスト情報を追加してみる - Qiita

    前身となった記事 2つを掛け合わせたような記事です. タグ同士のリンク情報に加えて,記事内容をベクトル化したものを加えることで,さらに良い推論結果が出せるのではないかということで実践してみることにしました.Heterogeneous Graphをカスタムデータに使ってみたいという方におすすめです. 以下の流れで実装を進めていきます. データセットの用意 テキストデータをベクトル化 グラフデータを用意する 学習 評価 実装のnotebookはgithubに挙げてますので,記載していない細かい部分が気になる方はそちらを参照してください.(あまり精査してませんが) https://github.com/taguch1s/qiita-tag-recommend/tree/main いろいろ細かい部分はスルーしてとりあえず実装までこぎつけた感じなので,気になる部分がありましたらご教授いただけますと幸

    QiitaのGNNタグ付けレコメンドにテキスト情報を追加してみる - Qiita
    sh19910711
    sh19910711 2024/05/01
    "タグ同士のリンク情報に加えて,記事内容をベクトル化したものを加える / 内容とタイトルのテキストデータを結合してdoc2vecで学習 / タグのテキストデータをグラフで利用できる形に変換 + pytorch-geometricのtutorial を参考"
  • グラフニューラルネットワーク(GNN; Graph Neural Network)入門 - あつまれ統計の森

    前提知識 Transformerとグラフニューラルネットワーク 下記で詳しく取り扱いました。当記事は下記の副読的な内容になるように取りまとめました。 「Transformer=グラフニューラルネットワーク+ネットワーク分析」と大まかに解釈できるので、当記事ではグラフニューラルネットワークについて詳しく取り扱います。 集合と要素 グラフ理論では基的に数ⅠAの「集合」で取り扱われる内容を元に立式されます。当項では「集合」の基的な式表記の確認を行います。たとえばサイコロの出目の$1$〜$6$の集合を$X$とおくとき$X$は下記のように定義できます。 $$ \large \begin{align} X = \{ 1, 2, 3, 4, 5, 6 \} \end{align} $$ このとき$X$の要素を$x$とおくと、$x \in X$のように表すことができます。$x \in X$は$x$が$

    グラフニューラルネットワーク(GNN; Graph Neural Network)入門 - あつまれ統計の森
    sh19910711
    sh19910711 2024/04/28
    "Transformerを理解するにあたってはGNNを理解しておくことで直感的な理解が可能 / GNNの数式表記に関しては様々なものがありますが、MPNN(Message Passing Neural Network)の定義を元に考えると理解しやすい" 2023
  • GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ - 機械学習とかコンピュータビジョンとか

    はじめに GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ.Generative flowを使ってmolecular graphを生成する初めての試みとのこと. GraphNVP Generative Flowの一般的な話は何度か記事にしているのでここでは割愛. 今回は,molecular graphをgenerative flowを使って生成するのが目的.ここではグラフの生成を,ノードの隣接関係の記述とノードの表現(ラベル)の二つに分けて考える. 定義として,グラフをとし,をそれぞれ,adjacency tensorとfeature matrixとする.ただし,隣接関係の種類を,ノードのラベルの種類をとした.グラフが与えられた時にとなるようなモデルを作る.今回はモデルとしてGenerati

    GraphNVP: An Invertible Flow Model for Generating Molecular Graphsを読んだのでメモ - 機械学習とかコンピュータビジョンとか
    sh19910711
    sh19910711 2024/04/26
    "GraphNVP: molecular graphをgenerative flowを使って生成 + グラフGは離散的に表現 + 上で議論したモデルは連続な分布 + ギャップを埋めるためuniform noiseを加える (dequantization) " arXiv:1905.11600 2019
  • 『グラフニューラルネットワーク』を上梓しました - ジョイジョイジョイ

    グラフニューラルネットワーク (機械学習プロフェッショナルシリーズ) 作者:佐藤 竜馬講談社Amazon 講談社より『グラフニューラルネットワーク(機械学習プロフェッショナルシリーズ)』を上梓しました。 グラフニューラルネットワークはグラフデータのためのニューラルネットワークです。化合物やソーシャルネットワークのようなグラフデータの解析に使うことができます。また後で述べるように、テキストも画像もグラフなのでテキストや画像の分析にも使えますし、それらを組み合わせたマルチモーダルなデータにも適用できます。要は何にでも使うことができます。この汎用性がグラフニューラルネットワークの大きな強みです。 稿ではグラフニューラルネットワークを学ぶモチベーションと、書でこだわったポイントをご紹介します。 グラフニューラルネットワークは何にでも使える 付加情報をグラフとして表現できる グラフニューラルネッ

    『グラフニューラルネットワーク』を上梓しました - ジョイジョイジョイ
    sh19910711
    sh19910711 2024/04/26
    "転導学習 (transductive learning) の訳にはこだわり / 既知の具体的事例を「転」じて、未知の具体的事例を「導」く / 既存の日本語の文献ではトランスダクティブ学習と訳 + トランスダクティブの意味を初見で取るのは不可能"
  • PAKDD2023報告 - Qiita

    はじめに 2023年5月25日(木)から5月28日(日)にかけてPAKDD2023大阪で開催されました。PAKDDは、データマイニングを主とした国際会議です。この記事では、個人的に注目した発表についてポイントを整理し、読んでいただいた方に雰囲気を掴んでいただくことを目指します。 PAKDD2023 https://pakdd2023.org/ プログラム https://pakdd2023.org/program/ 会議の様子(同僚執筆のQiita記事) 国際会議PAKDD2023に聴講参加してきました チュートリアル Moving Beyond Traditional Anomaly Detection 要約:2022年くらいまでの異常検知技術を整理したチュートリアル ポイント: Shallowモデル(kNN、LOF、ヒストグラムベース、PCA、iForest)とDeepモデル(AE、

    PAKDD2023報告 - Qiita
    sh19910711
    sh19910711 2024/04/24
    "PAKDD: データマイニングを主とした国際会議 / Wang: グラフで情報を効率的に捉えるために、情報の構造を階層的、周期的などと分類 + 適切な潜在空間(超球やユークリッド空間)を与えることで、性能を向上" 2023
  • Hadoop Conference Japan 2011 Fallに行ってきた - seikoudoku2000のブログ

    Hadoop Conference Japan 2011 Fallに行ってきた。 eventbrite http://hadoop-conference-japan-2011-fall.eventbrite.com/ リクルートのMIT作成のQAやら講演資料のサイト (現状、一部の資料がアップされているのみ。) http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html 午前中のセッションに関しては、ITProのニュースになってたり、他のブログでも書かれていたり、技術的にはこれといった話が無かったりだったので略。 午後はずっとCommyunity Trackのセッションを聞いていたので、そのまとめ。 Elastic MapReduce: Amazon Web Serviceが提供するhadoopサービス  @sh

    Hadoop Conference Japan 2011 Fallに行ってきた - seikoudoku2000のブログ
    sh19910711
    sh19910711 2024/04/24
    "Pregelにインスパイアされたプロジェクトたち: Hama + GoldenOrb + Giraph / webは元々Graphだしということで、IT業界はどこを見てもGraphに到達する / LSH: 効率はいいが、精度に問題がある + 関数が肝 + likelikeではMinHashを利用" 2011
  • PyTorch Geometricのデータセットの自作するための簡単なまとめ - Qiita

    PyGはグラフの機械学習に有用だが、データセットの自作が最初は難しかったので最低限必要な知識を記しておく。 InMemoryDataset CPUメモリに収まるデータセットを構成できる便利なクラス。 概観 最初にインスタンスを生成すると、processメソッドが呼び出されてデータセットが処理される。 torch.save()でデータがdata.ptに保存され、次回以降高速に読み込める。 最低限知っておけばよいメソッド raw_file_names 処理前の生のデータのファイルがあればここに書いておく。 processed_file_names 処理されたデータが、__init__で渡したディレクトリの下にこのファイル名で保存される。 process グラフのノード, エッジ, 重み, 特徴量の設定などを行う。基的にtorch_geometric.data.Dataクラスでグラフを表現し、

    PyTorch Geometricのデータセットの自作するための簡単なまとめ - Qiita
    sh19910711
    sh19910711 2024/04/24
    "PyG: グラフの機械学習に有用 + データセットの自作が最初は難しかった / InMemoryDataset: CPUメモリに収まるデータセットを構成 / インスタンスを生成すると、processメソッドが呼び出されてデータセットが処理" 2023
  • Chain-of-Thoughtを使ったText-to-Cypher - Insight Edge Tech Blog

    はじめに はじめまして、InsightEdge 分析チームの中野です。 今回は自然言語からCypherクエリを生成する手法について、LLM(大規模言語モデル)を用いたアプローチを紹介します。 最近、RAG(Retrieval-Augmented Generation)という手法が注目されています。これは、LLMが外部の知識ベースを検索し、その情報を基に回答を生成するプロセスです。また、外部知識にナレッジグラフを利用することでデータを構造化し、より関連性の高い情報を抽出することも注目されています。 ナレッジグラフを使用するにはneo4jのようなグラフデータベースを使用することが一般的です。 しかし、このRAGプロセスではテキストからグラフクエリ言語であるCypherクエリを生成する必要があります。 この記事では、このRAGプロセスでCypherクエリを生成する際の課題と、Chain-of-T

    sh19910711
    sh19910711 2024/04/23
    "text-to-cypher: 自然言語からCypherクエリを生成 / 質問文ではクエリの構成を具体的に指定しないため、必ずしも適切なクエリを生成できない / クエリの精度はJaro-Winkler距離 + 応答結果の精度はJaccard係数で測定"
  • 確率モデルを使ったグラフクラスタリング

    Statistical machine learning forecasting methods concerns and ways forward

    確率モデルを使ったグラフクラスタリング
    sh19910711
    sh19910711 2024/04/23
    "ネットワーク構造を知りたいからクラスタリングを行うのにネットワーク構造を仮定するのは矛盾 / 確率モデル: リンクの生成モデルを考え、モデル学習を通じてクラスタリング + クラスタの構造は仮定しない" 2013
  • 【論文紹介】E(n) Equivariant Graph Neural Networks - Pseudo Theory of Everything

    対称性が課された機械学習の理論に興味があり、なんとなく探していたところ、最近出た論文に読みやすそうなものがあったので読んでみました。次の論文を紹介したいと思います。 arxiv.org イントロダクション この論文では、グラフニューラルネットワーク(GNN)に \(E(n)\) 変換のもとで同変(equivariant)性を課したモデルを構築しています。 \(E(n)\) は \(n\) 次元ユークリッド空間での等長変換群であり、回転、並進、鏡映、置換からなりますが、今回の論文では基的に回転と並進に着目しているように思えます。このような変換を考えることのモチベーションとしてはData Augmentationなどがあるようで、著者たちの過去の関連論文では arxiv.org などがあります。後に紹介しますが、グラフニューラルネットワークに対称性を課した研究は、点群(point cloud

    【論文紹介】E(n) Equivariant Graph Neural Networks - Pseudo Theory of Everything
    sh19910711
    sh19910711 2024/04/22
    "n次元ユークリッド空間での等長変換群 + モチベーションとしてはData Augmentationなど / 従来のグラフニューラルネットワークで使われるノードの特徴ベクトルhの他に実際のノードの座標であるxを導入" arXiv:2102.09844 2021
  • Rによるネットワークデータのプロット

    sh19910711
    sh19910711 2024/04/22
    "statnet: ネットワーク分析やプロットに使うパッケージが一通り入ってる / igraph: (statnetほどじゃないけど)基本的な関数はそろっている / Ggraphでも同じようなことができる" 2021
  • 論文解説: P-Companion: A Principled Framework for Diversified Complementary Product Recommendation - Qiita

    論文解説: P-Companion: A Principled Framework for Diversified Complementary Product RecommendationMachineLearningDNNRecommendation論文読みGNN はじめに P-Companion: A Principled Framework for Diversified Complementary Product Recommendation というAmazonがCIKM2020に投稿した論文について解説します。 論文を選んだ動機 E-Commerceサイトの推薦では、ユーザーが見ている商品詳細ページに対して、以下2種類の商品を推薦することが多いです。 substitute: 現在見ている商品と代替関係にある商品 complementary: 現在見ている商品と合わせて買われるよう

    論文解説: P-Companion: A Principled Framework for Diversified Complementary Product Recommendation - Qiita
    sh19910711
    sh19910711 2024/04/21
    "「co-purchase(一緒に買われる商品)が、常に補完商品になる」という仮定が成り立たないことを示し / Product2Vec: GNNで商品情報から商品ベクトルを作成 + ログの少ない商品に対する推薦も可能に" doi:10.1145/3340531.3412732
  • 【論文紹介】 Node2Vecでネットワークのベクトル埋め込みを学習する。 - Qiita

    卒論のためにNode2Vecの論文を読んだので、この手法でネットワークの構造を学習する方法について解説します。数式を追わなくてもある程度理解できるようになっていると思います。 参考元 元論文: node2vec: Scalable Feature Learning for Networks PyTorch GeometricのNode2Vecモデル: torch_geometric.nn.models.Node2Vec 再現実装の際にPyTorch Geometric(PyG)のモデルを用いたので、論文に明記されていない学習方法などはこちらを参考にしました。 Node2Vecとは Node2Vecは、 ランダムウォークによってグラフの特徴が乗った系列を生成する 生成したウォークの系列をWord2VecのSkip-Gramモデルの入力とし、目的関数を最適化する という手順でグラフの分散表現を

    【論文紹介】 Node2Vecでネットワークのベクトル埋め込みを学習する。 - Qiita
    sh19910711
    sh19910711 2024/04/20
    "参考元 PyTorch GeometricのNode2Vecモデル / Node2Vec: 半教師あり学習によって計算速度と精度を両立 / Negative Samplingの論文やNCE(Noise Contrastive Estimation)などについて調べてみると良い" 2023
  • 【KDD2020 Workshop採択論文紹介】GCNで時系列予測!? - Qiita

    明示的にグラフ構造でないデータに対してもGraph Convolution Network(GCN)が使える!? ドコモの久保田です。この記事では、データマイニングの国際会議であるKDD2020で開催されたThe Second International Workshop on Deep Learning on Graphs: Methods and Applications (DLG-KDD’20)に採択された私たちの論文"Time-aware GCN: Representation Learning for Mobile App Usage Time-series Data"を紹介します。論文はKDDのリンクのページからダウンロードできます。 KDD2020の投稿傾向 KDD2020のOpening1でResearch Trackのトピックごとの投稿論文数が報告されていましたが、上位2

    【KDD2020 Workshop採択論文紹介】GCNで時系列予測!? - Qiita
    sh19910711
    sh19910711 2024/04/18
    "Time-aware GCN: 時系列データをグラフデータとして捉える / アプリ間の利用時間間隔がΔt_thであれば、アプリ間にエッジを張る / 良い表現を獲得できたかを、次のアプリを予測するタスクとして定義" KDD2020