我愛學習網-上傳
當前位置: 主頁 > IT資訊 >

沒有“好的”數據,AI就沒有未來?聽聽云測數據

時間:2019-12-26 13:20來源:我愛學習網 作者:apple 點擊:

算力、模型和數據構成了人工智能的三要素,過去,我們過多的把目光聚焦于算力和模型上,殊不知,隨著人工智能的深入,好的算法和模型已不再是稀有物種,反而那些被標注好的優質數據成為時下最為稀缺的“黑金”。

“公司的壁壘不再是算法,而是數據。讓算法利用足夠的數據,使得產品運行起來。”人工智能和機器學習領域國際的權威學者吳恩達在發表以“AI is the new electricity”為主題的演講時,就重點強調了數據的重要性。無獨有偶,李開復在清華大學“清華學堂計算機科學實驗班”題為《人工智能的黃金時代》的演講中也講到了此類觀點,“如果你有壟斷性的大數據,你就會有很大的優勢。”

以上種種,都表明著一件事,即AI的崛起離不開“好的”數據作為地基,這也是云測數據成立的初衷所在。

溯源云測數據的AI數據服務之路

“自2011年切入企服市場以來,Testin云測不斷致力于助力產業智能化,除了測試業務我們已經成為專業領域的壟斷品牌,專注于AI數據服務的云測數據也成為數據領域的標桿品牌。目前我們整個數據服務團隊規模已超過1000人,通過標審分離的流程化作業模式和數據安全機制,更好的保證數據的高質量產出和數據隱私性,從而更好地為人工智能落地提供定制化‘數據養料’。”在接受鈦媒體專訪時,云測數據總經理賈宇航如是說。

AI數據服務作為一個非標領域,往往需要根據不同行業領域、不同的需求進行特定化的場景定制,而數據標注的過程,規范化、標準化以及可機讀性又不可或缺,這就意味著云測數據所從事的領域,并沒有捷徑可以走。

早期的數據標注服務門檻并不高,幾個人、幾臺電腦便可展開操作,導致了行業魚龍混雜、同質化競爭等現象,而這時的人工智能也處在初期發展階段。但當人工智能駛入深水區,“應用人智能”聲勢逐漸火熱,相對應的算法對數據的精準程度和質量要求也水漲船高,就要求著作為AI數據服務的提供者,要為人工智能提供定制化的、還原應用場景的優質數據。

針對于此,賈宇航告訴鈦媒體,“以人臉關鍵點識別為例,早先的相關數據標注往往用一句話便可描述完它的任務需求,到了現在,已經發展到幾百個關鍵點。通常數量級的人臉數據標注任務,有時候4張A4紙都未必能寫完這些需求,而人臉的數據標注只是眾多領域的任務需求之一。”

龐大數據標注任務量級之下,是當下業內需求端對精準和高質數據的普遍共識。

這就要求著數據服務要在數據標注和采集上下足功夫,而小團隊的能力范圍則顯得捉襟見肘。回歸到數據標注面向多領域這件事的本質時,你又會發現,光靠人多或者說采用“眾包”模式往往只能解決量的需求,數據標注人員是否能統一化協同管理以及是否具備相關領域知識,才是決定某項數據任務完成質量的好壞。

同時,這也是云測數據當下正專注的事情。正如醫生可以標注得好ct診療片,而云測數據團隊在進行自動駕駛車外環境數據標注時發現,那些能夠快速、精準進行數據標注的人員往往擁有駕駛經驗。

云測數據快速成長的秘訣是什么?

至此,我們還需要思考一個問題,為什么云測數據能做到且做好AI數據服務?

通過觀察Testin云測的發展歷史,我們便能找到答案。

自2011年Testin云測成立到現在,已經為全球超過百萬的企業及開發者提供服務,積累了豐富且完善的技術能力和流程化管理能力。而云測數據AI數據服務正式開展于2017年,換句換說,Testin云測的數據業務線從一出生便擁有7年企業服務所積攢的經驗,并繼承了行業獨立第三方的角色,天然的“以客戶為中心”的企服基因是云測數據區別于同行的最大護城河,而客戶最為關鍵的訴求則是“降本增效”。

“與企業服務在美國環境更側重標準不同的是,中國更重服務,通過這么多年的觀察我們發現,是否能切實滿足用戶的真實需求,其實是一個非常重要的點,并不是說企業一定要做出一個平臺或者一個工具,更多是從企業或行業需求出發,構建對應的服務模式。”賈宇航對鈦媒體補充到。

以新零售門店巡檢為例,通常來說,每個門店每月都要巡檢一次,門店巡檢模式是讓一個人拿著調研表去盤點,隨著人工成本的增加,而門店數越來越多現實情況,已經讓這成為一筆不小的開銷。通過引入AI數據服務,現在工作人員可以拿一個手機APP直接巡檢,物品的數量、sku的數量以及對應的sq數量,都能一目了然。

 “從不同客戶反饋得知,通過我們云測數據的數據標注服務而落地AI產品的企業,可為企業減少大概1/3的人工成本。”賈宇航如是說。

門店巡檢只是案例之一,就目前來說,云測數據主要關注智能駕駛、智慧城市、智慧金融和智能家居幾大方向,這也是當下市場需求最大的幾個領域。面對不同的數據領域,云測數據通過流水化作業,將各個環節打造成不同模塊,并配合自己的流程管理工具,優化人員管理、數據采集、數據清洗和數據標注的各個環節流程,確保內部的持續高效能運轉,最終保證AI數據高質產出。

根據IDC調查顯示,目前中國大數據發展處于應用落地階段,整個市場預計未來五年將保持持續增長的趨勢,年復合增長率將達到17.3%。而得益于人工智能、5G、區塊鏈、邊緣計算的發展,未來多方技術融合,數據增長必然呈現井噴態勢,數據采集和標準業務作為其伴生體,必然有較大的增長空間。

得益于對AI趨勢的判斷,Testin云測認為,“人工智能正在逐漸往應用人工智能”方向發展,因而云測數據在成立之初,就確定了定制化“精準高質、獨立安全”業務方針。本著這張“王牌”,云測數據部門迅速擴充,在以往企業服務經驗的完美嫁接之下,最終讓云測數據成為AI數據服務領域的頭部企業。”

“云測數據業務規模量每年都在以倍數的規模增長,這也與我們所處賽道的市場深度息息相關,在我看來,整個市場仍然呈現非線性的幾何增長態勢,還有很多機會蘊含其中,有待挖掘。”談及云測數據業務線發展狀態時,賈宇航如是說。

“安全”是AI數據服務提供商繞不開的命題

機會之下,企業端在提供優質數據的同時,也要注意數據服務過程中的規范和安全。

在這方面,云測數據通過自建數據采集實驗室和自建數據標注基地的方式,規范管理專職數據服務團隊。這種措施除了保證標注數據的質量和效率,也最大限度地保證了數據產出的安全隱私性。

賈宇航對鈦媒體強調到,云測數據自伊始便將數據安全放在首位,集中表現在以下幾個方面:

第一,不濫用數據,數據交付后清毀數據不留底,絕不二次使用;

第二,不侵犯隱私,與所有數據采集的用戶都簽訂數據授權協議,確保AI企業用于訓練的數據合法合規;

第三,建立相關的數據保障機制,如從防火墻的設置、內部信息系統的管護、乃至標準化的流程作業體系等。

正如Testin云測CMO張鵬飛多次強調:“即便說云測數據從安全到隱私防護這套體系會加重運營成本,但從我們行業大局發展來看,只有以這種負責的態度來執行工作,我們的行業才能‘良幣驅除劣幣’。”

------分隔線----------------------------
    ?分享到??
看看啦
主站蜘蛛池模板: 国产精品日本一区二区在线播放| 成人精品一区二区不卡视频| 老熟妇仑乱视频一区二区| av无码免费一区二区三区| 成人精品视频一区二区三区不卡 | 日韩精品视频一区二区三区| 国产av一区二区精品久久凹凸| 日韩好片一区二区在线看| 国产伦精品一区二区免费| 国产一区二区在线视频播放| 亚洲综合激情五月色一区| 91视频一区二区| 亚洲电影国产一区| 亚洲A∨无码一区二区三区| 中文字幕乱码一区二区免费| 狠狠色婷婷久久一区二区三区| 日韩国产一区二区| 无码人妻精品一区二| 国产亚洲福利精品一区二区| 日韩精品一区二区三区中文版| 黑巨人与欧美精品一区| 手机福利视频一区二区| 波多野结衣一区二区三区高清在线| 成人h动漫精品一区二区无码| 糖心vlog精品一区二区三区| 亚洲综合av一区二区三区| 亚洲精品精华液一区二区 | 红桃AV一区二区三区在线无码AV| 国产一区二区三区电影| 国产一区精品视频| 全国精品一区二区在线观看| 国产嫖妓一区二区三区无码| 男人的天堂亚洲一区二区三区| 一区二区三区视频免费观看| 国产精品亚洲产品一区二区三区| 中文字幕一区二区三区四区| 无码人妻精品一区二区三区夜夜嗨| 色欲AV蜜臀一区二区三区| 色狠狠色狠狠综合一区| 日本韩国一区二区三区| 国产美女av在线一区|