注目ベンチャー紹介:PuppyGraph

Written by Yuhei Yano
今回の注目ベンチャーの紹介はPuppyGraphです。
既存のデータ基盤(Databricks、Snowflake、BigQuery、各種データレイクなど)の上で動作するGraph Query Engine(グラフクエリエンジン)であり、データを移動・複製することなくリアルタイムにグラフ分析を可能にするプロダクトです。
PuppyGraph
サービス/プロダクト概要
- 従来のグラフデータベースとは異なり、新たなデータストアを構築する必要はなく、既存の構造化データ(テーブルやParquetファイル)をそのまま活用しながら、CypherやGremlinといったグラフクエリで関係性を探索できる。
- 近年ではポジショニングを拡張し、単なるグラフ分析ツールではなく、「AIエージェント向けのデータ実行基盤(AI-native data compute framework)」としての位置付けを強めている。特にGraphRAG(GraphベースのRAG)において、既存データをそのまま活用できる基盤として注目されている

特徴/提供価値
1.Zero-ETLによるリアルタイムGraph化
- 従来のグラフ分析では、データを別のグラフDBに移行するETLが必要だったが、PuppyGraphは既存データをそのままGraphとして扱う。
- これにより、構築コスト・運用負荷を大幅に削減し、即時に分析環境を立ち上げることができる。
2.大規模データへのスケーラビリティ
- Lakehouse(Databricks、Iceberg等)の上で動作するため、従来のグラフDBが苦手としていたTB〜PB級データの処理が可能
- 特に1TBを超える規模では、グラフDBではなくPuppyGraphが選択されるケースが増えている。
3.「意味を壊さない」データ実行
- PuppyGraphの本質的な価値は、単なる高速クエリではなく、データの意味(ontology)をエンジンに組み込んでいる点にある
- 通常のSQLエンジンは構文的に正しければどんなクエリも実行するが、PuppyGraphは「存在する関係のみを辿る」ため、意味的に誤った結合を防ぐ。
- これはAI時代において極めて重要であり、「正しい答えを出す」のではなく「間違った答えを出せなくする」というガードレール的価値を提供する。
4. GraphRAGにおける適合性
一般的なRAG(Vector RAG)は類似検索ベースであり、関係性の理解に弱い。一方でPuppyGraphは、構造化データをベースにしたGraph探索により、
- multi-hop(多段関係探索)
- 因果関係の追跡
- 精度の高い推論
を可能にする。「広く拾うVector」ではなく、「正しく絞るGraph」側のRAG基盤として昨
5.AIエージェント時代のデータ基盤
同社はプロダクトを「AIエージェントのためのデータ基盤」として再定義している。
従来:
- MapReduce → バッチ処理
- Spark → 人間の分析
PuppyGraph:
- AIがリアルタイムにデータを扱うための基盤
ビジネスモデル
コンピュート課金(CPU・メモリベース)を採用している。
- クエリ実行時の計算資源使用量に応じた従量課金
- エンタープライズ契約(例:XYX社で約39万ドル/年)
- データセンター単位での導入 → 横展開でスケール
特徴的なのは、ストレージではなく「どれだけ複雑な関係を計算したか」に対して課金される点である。
また、Docker版を起点としたインバウンド型のGTM(技術検証→本番導入)も機能している。
市場動向・なぜこの会社なのか?
1.Graph領域の未開拓なポジション
- SQLの世界には「データベース」と「クエリエンジン」が存在する一方、グラフ領域は長らくデータベース中心で発展してきた。
- PuppyGraphはこのギャップに対し、「Graph Query Engine」という新カテゴリを提示している。
2.Lakehouse普及による前提変化
DatabricksやSnowflakeの普及により、データはすでに一箇所に集約されている。
この環境では、
- データを移動するのではなく
- その場で別の視点(Graph)を提供する
方が合理的となり、PuppyGraphのアーキテクチャが成立した。
3.AIエージェント時代の到来
従来:
- 人間がクエリを書く
今後:
- AIがクエリを書く
問題は「ハルシネーション」であり、
これに対しPuppyGraphは、制約付きデータ実行エンジンとして機能する(「存在する関係のみを辿る」ため、意味的に誤った結合を防ぐ)
4. GraphRAGの台頭
RAGは現在Vector中心だが、複雑な関係性を扱う領域では限界が見え始めている。
今後は:
- Vector RAG(広く拾う)
- Graph RAG(正確に絞る)
のハイブリッドが主流になる可能性が高い。PuppyGraphはこのGraph側の中核ポジション
顧客・競合・パートナー
- 顧客:
- Cybersec,金融など
- Cybersec,金融など
- 競合:
- Neo4j / TigerGraph(Graph DB)
- Amazon Neptune
- Databricks / Snowflake(代替的実装)
- パートナー
- Databricks
- AWS
- Cloudera
などの既存データWarehouseと補完関係を築きやすい構造