本系統是一套專為跨境電商設計的全自動化翻譯解決方案,專注於將韓國時尚產品內容在地化為繁體中文。系統結合 AI 翻譯、OCR 圖像識別、向量搜尋等先進技術,能夠處理大規模商品資料庫的即時翻譯與同步。
採用 OpenAI GPT-4o-mini 進行語境感知翻譯,確保商品標題、描述、選項等內容的精準度與流暢性
整合 OCR 服務自動提取並翻譯商品圖片中的韓文內容,包含尺寸表、產品說明等嵌入文字
2000+ 韓中對照詞彙,支援位置智慧過濾(標題/內容/選項/通用),確保品牌術語一致性
使用 Qdrant 向量資料庫與 OpenAI embeddings,實現跨語言的語義商品搜尋功能
自動將圖片轉換為 AVIF 格式,大幅降低檔案大小並提升網站載入速度
每日 4 次自動執行(凌晨 1 點、早上 7 點、下午 1 點、晚上 7 點),確保內容即時更新
基於 Hash 的變更偵測,僅處理更新的商品內容,大幅提升處理效率
翻譯內容自動上傳至 Azure Blob Storage,支援 AWS S3 備援方案
爬取韓文商品資料
提取圖片文字
GPT-4 + 詞彙庫
HTML + 圖片替換
Azure Blob 上傳
MySQL 同步
Qdrant 搜尋
深度整合 OpenAI GPT-4 與 embeddings API,實現高品質翻譯與語義搜尋的完美結合
從資料爬取、OCR、翻譯、圖片處理到雲端儲存,提供端到端的完整解決方案
AVIF 圖片格式轉換、批次處理、Hash 快取等多重優化策略,確保系統高效運行
運用 Qdrant 向量資料庫實現語義層級的商品搜尋,突破傳統關鍵字搜尋限制
本系統已成功部署於生產環境,穩定服務 A41 電商平台: