DownloadsContact

Where datameets discovery.

あらゆる発見の基盤となるデータを。

AI開発の基盤となる高品質データを
産み出すソリューションを提供します。

FUJITSU
東京大学
SoftBank
Canon
TOPPAN
MITSUBISHI ELECTRIC
PANASONIC
RICOH
SUNTORY
PIONEER
FUJIFILM
cohere
フジミック
SCSK
Minebea
NTTDATA
MITSUI&CO
順天堂大学

Data Format

業界・用途に特化したデータフォーマットで、様々なAIデータ課題に対応。

LLM/NLP
自然言語処理
金融・法務・カスタマーサポート
Images
画像認識・解析
製造業・医療・小売
Videos
動画解析・理解
メディア・監視・スポーツ
3D(LiDAR)
空間認識・測距
自動運転
Physical AI
ロボティクス
Audio
音声認識・生成
通信・エンターテイメント

Improvements

国内外の多様なモデル、ベンチマークに対して精度改善を実現します。
自然言語のみならず、学習用/評価用にさまざまなデータセットを開発しています。

数学推論データセット
LLMの数学推論能力を改善させるデータセット
Benchmark | AIME2025
1
gpt-oss-20b
43.3+10.0
2
Qwen3-32B
36.7+10.1
3
gpt-4o-mini
10.0+6.67
安全性データセット
LLMがより安全な回答を行えるようにするためのデータセット
Benchmark | AIME2025
AnswerCarefully
1
Gemma3-27B
90.18+11.31
2
Qwen3-32B
86.01+9.52
SafeDialBench
1
Gemma3-27B
49.44+15.87
2
Qwen3-32B
44.62+4.71
指示追従データセット
LLMの指示追従性能を改善させるためのデータセット
Benchmark | M-IFEval
1
shisa v2 qwen2.5-32b
58.85+1.44
2
deepcogito v1-preview qwen-32B
60.73+1.22

Services

お客様のご要望に応じて、プラットフォーム提供から個別開発までお選びいただけます。

herbest

AI Data Platform
SaaS
PlatformとCloud workerを活用し、
自社内でアノテーションを実現。
クラウドワーカーを活用した
データ収集&アノテーション
自然言語 | 画像/動画 | 音声
自社リソースを活用した
データ収集&アノテーション
自然言語 | 画像/動画 | 音声

herbest

AI Data Platform
専門家の知見を活用したAIデータ生成・
管理プラットフォーム。

AI Solutions

ソリューション受託開発
データ収集からモデル開発・
システム構築まで、専門チームが対応
複雑なデータ収集や
アノテーション
自然言語 | 画像/動画 | 音声
受託開発
AI開発 | システム開発
RAG開発 | LLM開発

AI Datasets

ダウンロード形式
すぐにAI開発を始めたい企業向け。
高品質な既製データセットを販売。
画像/動画
医療 | インフラ | 食品
...etc
音声
会話データ | エンジン音
...etc
自然言語
LLM用
Instruction Tuning

Use Cases

課題に応じたソリューション提案をオンデマンドで実装いたします。

LLM/SFT/RLHF
Agent
RAG
Eval
Physical AI
物体検出
音声認識

データで、
革新のきっかけを。

APTOの高品質AIデータで、あなたのビジネスに新たな可能性を。
まずは資料請求からお気軽にお問い合わせください。