數據外包工作:兼職賺外快還是詐騙? 詳解數據標註工作始末

Scale AI Illustrations As CEO Says US Risks Losing AI 'Ammunition' Edge to China

(SeaPRwire) –   在 , , 和其他地方,用戶上傳的帖子聲稱,他們在空閒時間完成 DataAnnotation.tech、Taskup.ai、Remotasks 和 Amazon Mechanical Turk 等網站上的小任務,每小時可以賺 20 美元,甚至更多。

隨著企業爭相打造 AI 模型,對「數據標註」和「數據標籤」工作的需求激增。員工完成撰寫和編碼等任務,而科技公司隨後會利用這些任務來開發人工智能系統,這些系統接受大量範例數據點的訓練。有些模型要求所有輸入數據都由人類標籤,這是一種被稱為「監督式學習」的技術。雖然「非監督式學習」日益普及,其中 AI 模型以未標籤數據為輸入,但使用非監督式學習訓練的 AI 系統通常仍然需要一個涉及由人類標籤數據的最終步驟。

目前沒有人精確估計從事數據標註工作的人數。2022 年 Google Research 估計人數在數百萬,且在未來可能會增長至數十億。2021 年的一項 研究估計,有 1.63 億人在線上勞動力平台上建立個人資料,其中 1400 萬人至少透過該平台取得過一次工作,而 330 萬人完成過至少 10 個專案或賺取了至少 1,000 美元。(不過這個數字對於數據標註工作而言,可能會高估,因為並非線上勞動力平台上所有的工作都是數據標註工作。)

數據標註網站(通常是較大公司的子公司)可以提供賺錢的合法途徑。隨著 AI 產業持續成長,對人類標籤員的需求也隨之成長。但潛在使用者應當注意,數據標籤產業的監管不善,且由於這個產業不透明,因此探索起來可能會很困難。以下是您需要了解的事項。

如何開始從事數據標註工作?

要符合資格參加這些計畫,員工必須先完成評估。初始評估的時長會因人而異,但使用者通常會報告長達 1 小時或 3 小時的時數。如果使用者通過評估,他們應會開始透過該網站收到付費工作的邀請。如果使用者未被錄取參加計畫,一般來說,他們在完成評估後將不會收到任何消息。 

評估中的任務性質會不盡相同。負責 AI、勞動力和經濟計畫的非營利組織 Partnership on AI 的 Sonam Jindal 表示,趨勢朝著技能要求更高的數據標註工作前進。「我們將開始發現,由於您需要有品質更高的 AI 模型,因此您也需要品質更高的數據,」她說。「我們可以找出某樣東西是貓還是狗,這很好。進階到更進階的任務——擁有在更多特定實際情境中有用的更進階 AI——您將需要更大的專業技能才行。」

這項工作能賺多少錢? 

在美國,該類網站通常會針對標籤照片和完成寫作練習等任務提供每小時 20 美元的報酬。技能要求更高的數據標註工作可以提供更高的報酬。例如,DataAnnotation.tech 提供編碼任務以每小時 40 美元計酬,而 Outlier.ai 則提供每小時 60 美元的化學任務。

Jindal 指出,美國境外的数据標籤員通常獲得的報酬低得多。但儘管價碼較高,企業可能還是會偏好美國的員工,例如需要特定文化知識或美國盛行的技能的任務。 

人們的體驗如何? 

在 上,用戶對於數據標註工作經歷了各種各樣的體驗。許多人描述了積極的經驗——簡便的上船流程、充足的任務供應和不錯的報酬。

「我在 [DataAnnotation.Tech] 工作了將近兩年,」一名用戶 寫道。「您可以透過任務或時薪賺錢,這取決於專案。他們透過 PayPal 付款。過去幾年來,我只有在兼職工作,但現在已接近 3000 美元。坦白說,我在全職工作時離職了一段時間,但現在又回來了。我目前正在進行兩個專案,一個以每小時 20 美元計算,另一個以每小時 25 美元計算。我每週可以賺到約 400 至 500 美元。這並不是永久性的,因為任務會不斷變化,但如果您需要利用筆記型電腦或電腦賺取額外收入,這是一個很好的方法。」

但也有人報告了一些不太好的體驗,例如被告知他們通過了評估,但從未被提供過任何任務。更令人擔憂的是,一些使用者報告他們的帳戶停用了,而有大量的收益尚未支付。一位使用者 寫道,他的帳戶停用了,且有價值 2,869 美元的未付工作,而他寫了電子郵件給公司的客服人員,但沒有收到回覆。

Weizenbaum-Institut in Berlin 的數據、演算法系統和倫理研究小組負責人 Milagros Miceli 表示,數據標註網站通常會使用演算法管理來降低成本,而這可能會導致許多員工經歷糟糕的對待。由於數據標註產業的監管不善,因此企業很少會因對員工的待遇低劣而面臨後果,」她表示。

Amazon.com Illustrations Ahead Of Earnings Figures

數據會用在何處?

一些公司,例如 Amazon Mechanical Turk 和 Upwork,會以相對透明的方式進行營運,對於數據標籤服務的購買者和員工來說都是同一個品牌。但其他公司並非如此。Remotasks 是數據標籤供應商 Scale AI 的面向員工的子公司,Scale AI 是總部位於舊金山的數十億美元企業,客戶包括 OpenAI、Meta 和美國軍方。類似地,Taskup.ai、DataAnnotation.tech 和 Gethybrid.io 是Surge AI 的子公司,而 Surge AI 是另一家數據標籤供應商,服務於 Anthropic 和 Microsoft 等客戶。

Miceli 表示,公司聲稱這種保密措施對於防止敏感的商業資訊(例如新的產品開發計畫)外洩是必要的。但他們也偏好保密,因為這會降低他們與潛在的剝削條件(例如 )產生關聯的機率。

Scale AI 的發言人將 TIME 指向了一個聲明,表示 Remotasks 成立為 Scale AI 的獨立公司,目的是保護客戶機密性,並舉出 Scale AI 為確保員工受到公平對待而採取的步驟。該發言人還表示,「Remotasks 沒有參與需要接觸敏感影像/影片的專案,且如果此類內容出現在資料集中,便可回報並從工作流程中移除。」

截至發布為止,Surge AI、Taskup.ai、DataAnnotation.tech 和 Gethybrid.io 尚未回覆置評請求。

Jindal 主張,數據工作在根本上被低估了,並建議可以對數據工作者為其協助創造的產品支付版稅。 

「他們的知識和資訊都被捕獲到了數據中,並用於訓練這些被稱為人工智能的 AI 模型,」她說。「這其實是他們的人類智慧,我們的集體人類智慧,被嵌入到了這些模型中。」

本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。

分類: 頭條新聞,日常新聞

SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。