Big Data & STDF

STDF/CSV/JSON対応とビッグデータ解析基盤

数十億〜兆レコード規模の半導体テストデータを扱うため、Lot単位のデータ構造、 MySQL 256シャーディング、Pythonベース解析エンジン、並列処理を前提に設計されています。

データ取得、Parser、解析エンジン、DB、アラーム通知、Client連携までの基盤構成
テスタ・MES・解析サーバ・解析クライアント間のテストデータ連携

データ構造

LotName
Lot単位の管理キー
Process
工程情報
Wafer番号(Wno)
Wafer単位の識別
チップ座標(Xadr, Yadr)
Site/チップ位置
Test項目
測定項目

技術仕様

データベース
MySQL、256シャーディング構成(Lot単位分散)
データ形式
STDF、CSV、JSON、その他カスタマイズ
処理エンジン
Pythonベース解析エンジン、並列処理対応
クライアント
Windows GUIアプリケーション

性能指標(参考値)

1Lot解析
数秒〜数十秒(約数百万〜数千万データ)
相関解析
1000項目で数分以内
並列処理
マルチスレッド対応

※データ量・環境に依存します。

Scalability

大規模データ対応のポイント

シャーディング

Lot単位分散により大量データへのアクセスを高速化。

並列処理

解析エンジンでマルチスレッド処理に対応。

NVMe I/O最適化

大容量テストデータの読み書きを前提に設計。

可変パラメータ

JSON測定データによりLotごとのパラメータ差異を吸収。