數位關鍵字77.AI再厲害,沒清理好自家數據也枉然!ft.台灣人工智慧學校蔡明順

數位時代 Business Next

2023-04-0800:24:12

Available Platforms

隨著生成式 AI 日趨成熟,各家企業都開始計畫著訓練專屬於自家的 AI 工具。而訓練 AI 工具的重點除了模型的建置、微調外,數據的蒐集、整理更是不可或缺的環節。數位時代創新長黃亮崢 James,邀請台灣人工智慧學校校務長蔡明順 Richie 來和大家聊聊數據處理有哪些重點。

1.要訓練自家 AI 工具首先需要從外部與內部分別蒐集資料、數據,接著按照其樣態(影像、文字、訊號…)、特性進行分類、清理,最後再餵給已建置好的模型。然而有些數據、物件會隨時間改變,此時就須要對模型進行重新訓練、佈署。

2.對數據、資料進行標記是應用 AI 工具相當重要的一環,平常在社交平台上按讚、使用搜尋引擎查關鍵字都是協助該平台對你的個人資料進行標記,透過眾包方式標記對企業而言所需的成本不高,甚至接近免費,但有些醫療診斷相關的 AI 模型資料需要高度的專業知識,相映地成本就會更高些。

3.企業想導入 AI 工具可以依據不同的需求準備各自所需的資料,如果想要建置人臉辨識的門禁系統,可以先準備臉部照片,如果做公司系統,平常就要備好資料倉儲,蒐集並整理各項資料。

//
☀最後一次學好商用英文☀新商業學校線上課全新上線>> https://pse.is/4sseq6

YT人氣英文老師Catherine ,教學逾10年、累積超過45萬粉絲學員,透過自創PLP學習法,教你用對關鍵字,自信開口說英文!搞定你的外國主管同事,讓外國客戶乖乖買單!
早買早學還有優惠價,新會員購課再折500元~>> https://pse.is/4sseq6

Comments