Big Data & STDF

STDF/CSV/JSON対応とビッグデータ解析基盤

数十億〜兆レコード規模の半導体テストデータを扱うため、Lot単位のデータ構造、MySQL 256シャーディング、Pythonベース解析エンジン、並列処理を前提に設計されています。

KAI_Analysis_Server_Systemの構成図。 — データ取得、Parser、解析エンジン、DB、アラーム通知、Client連携までの基盤構成

テスタ・MES・解析サーバ・解析クライアント間のテストデータ連携。 — テスタ・MES・解析サーバ・解析クライアント間のテストデータ連携

データ構造

LotName: Lot単位の管理キー
Process: 工程情報
Wafer番号（Wno）: Wafer単位の識別
チップ座標（Xadr, Yadr）: Site/チップ位置
Test項目: 測定項目

技術仕様

データベース: MySQL、256シャーディング構成（Lot単位分散）
データ形式: STDF、CSV、JSON、その他カスタマイズ
処理エンジン: Pythonベース解析エンジン、並列処理対応
クライアント: Windows GUIアプリケーション

性能指標（参考値）

1Lot解析: 数秒〜数十秒（約数百万〜数千万データ）
相関解析: 1000項目で数分以内
並列処理: マルチスレッド対応

※データ量・環境に依存します。

Scalability

大規模データ対応のポイント

シャーディング

Lot単位分散により大量データへのアクセスを高速化。

並列処理

解析エンジンでマルチスレッド処理に対応。

NVMe I/O最適化

大容量テストデータの読み書きを前提に設計。

可変パラメータ

JSON測定データによりLotごとのパラメータ差異を吸収。