周凱這里頭,路舟所看到的是有四排工位,每排所做也有一定區別。
一排的員工多是戴著耳機,聽取的內容應該是夢谷眾包處理過的微訊用戶的一些語音數據,他們會在聽取后將語音轉換成文字,個別指定的詞匯還會貼上屬性標簽。
這些語音在分包出來前會做進行一定的處理。
第二排則是圖片中文字選取,需要拉出選框選出文字,然后在選取后將文字打進系統中。
這中間又分成了印刷體和手寫體的區別,對人來說識別頗為簡單,但對機器卻成了兩碼事。即便是早期的OCR,統計分析后不可避免也需要一定的人工校對。
第三排的屏幕上則多是人臉圖片,員工需要在人臉上按照系統提示標注人臉上的特定位置,拉出標注線,也會需要標注些分類標簽,諸如性別人種面部朝向表情等。
第四排則多是男性員工,所做則是鑒黃和標注。他們需要從紛繁圖庫中一遍遍過圖,找出涉黃的圖片,再按要求進行分類標注等等。
看到這里,路舟也算是大略了解了一下周凱公司內的狀況。
盡管AI前景看似光明無比,可看到此情此景路舟卻感到了多少有些矛盾。即便他對這樣的場景也有所預料。
看似智能,卻需要建立在大量人非智能、不間斷重復的工作結果。
這里就像一個數據的工廠一般。
有多少人工智能,也許就有多少人工,路舟想。
不過某種意義上,路舟也需要借助這些人工才能獲取大量AI訓練的數據。
畢竟買數據是一方面,個別開放的標注圖片庫如image則是更適合于拼比比賽。路舟想要做適配自己系統的AI,那自然就還是得投入成本,這樣起碼能通過員工端來調整需要標注的范圍。
伴隨著未來推進速度越來越快,這些工作也許會再學著亞馬遜眾包一樣開始向亞非拉等發展中國家遷移以便拉低成本。但涉及了母語的類目,大抵還是只能在國內做。
周凱一邊迎了過來,“路總,怎么樣?”
路總微微點頭,“不錯。”
這倒是真心話。至少管理規劃上,周凱做得是比自己想象中要完善得多。
周凱微笑,“這邊給到的福利待遇還是不錯的,也不怎么加班。我們招人也多會去職專中找員工,畢竟工作雖是簡單,但還是要些電腦操作能力。”
路舟,“嗯。我安排開發個專門的標注系統,這樣我方便調整,你們也能提高效率。公司的問題,你直接找夢廣的王總談,我們以合資的形式做。記得帶上這頭的一些賬務去和他談。”
周凱一聽是好生大喜,在路舟身后朝王強東和周達兩人一揮拳,“沒問題路總!”
隨后路舟又回身提醒了一句,“我不反對分包到下頭的作坊處理,但需要你自己多有注意。原則上夢谷不會參與這公司的任何運作,我也只看結果。”
......
兩小時后。
路舟是推卻了周凱飯后活動的邀請,“直接帶我去酒店吧。聯系一下你的朋友,明天我想了解一下對方做siri項目的事情,如果方便的話。”
周凱點頭哈腰,“方便方便!我馬上聯系。”