摘要
一些有力的證據(jù)表明,AI頂級人才供不應(yīng)求。但是對于人才的稀缺度和集中度卻缺少精確的信息。為此,element.ai團隊連續(xù)第二年對全球AI人才的范圍和廣度進行調(diào)查。其研究主要依賴3個數(shù)據(jù)來源。1)AI領(lǐng)域21個領(lǐng)先的科學(xué)會議的出版物,分析其作者的概況。2)分析若干LinkedIn定向搜索的結(jié)果,看看有多少人自稱是博士并且具備相應(yīng)的必須技能的。3)外部報告及其他二手來源,幫助尋找相關(guān)背景,并更好地理解迅快變化的全球AI版圖中的人才情況。
報告發(fā)現(xiàn),2018年有22400人在一或多個機器學(xué)習(xí)的頂級會議上發(fā)表了論文,比2015年提升了36%,比去年也漲了19%。同行評審的出版物數(shù)量也比2015年提高了25%,比去年提高了16%。不過在這些會議上發(fā)表文章的研究人員當(dāng)中,女性僅占18%,顯得名額不足。報告還發(fā)現(xiàn),全球的AI人才池是高度流動的,大概有1/3的研究人員的雇主所在國家與其獲得博士學(xué)位所在國家是不一樣的。報告的分析表明,在21種刊物上發(fā)表過作品的作者當(dāng)中有18%(約4000人)對有著重大影響的研究(以過去2年被引用數(shù)為衡量)做出過貢獻。而擁有高影響力研究人員最多的國家依次是美國、中國、英國、澳大利亞以及加拿大。
對LinkedIn簡歷的輔助調(diào)查表明,有36524人符合自稱的AI專家資格,這比2018年的報告數(shù)字增加了66%。
此次調(diào)查的發(fā)現(xiàn)表明,無論是自我報告的AI專家數(shù)量,還是作者和在AI會議上發(fā)表的科學(xué)論文數(shù)量,均有了顯著的提升和拓展,這反映出該領(lǐng)域的活力和國際化。
介紹
對AI專家的需求空前高漲,自學(xué)習(xí)的算法預(yù)計可讓公司更好地駕馭發(fā)展性,獲取重要但此前不可見的信號,提供實時洞察,幫助員工更好地完成工作。
去年的第一次全球AI人才調(diào)查確認(rèn)了一個AI業(yè)界的普遍假設(shè):即有人工智能經(jīng)驗的博士很難找。今年的調(diào)查將學(xué)術(shù)會議的樣本從3個提高到21個。同時還細(xì)分了性別、人才流動以及影響力指數(shù)情況。同時,報告還收集了LinkedIn上面的簡歷情況來評估自我報告的AI專家趨勢。最后,報告還將發(fā)現(xiàn)與外部報告和來源的數(shù)據(jù)進行關(guān)聯(lián)。
女性在AI會議出版物作者中的占比依舊不足
我們?nèi)ツ旮哆B線》合作分析了人才池的情況,試圖弄清楚女性在機器學(xué)習(xí)研究人員的占比。我們的評估認(rèn)為目前這個領(lǐng)域的性別平衡問題依然非常嚴(yán)重:去年調(diào)查的3個領(lǐng)先的AI學(xué)術(shù)會議里面,我們發(fā)現(xiàn)只有12%的作者是女性。
今年的調(diào)查范圍擴大到了21個學(xué)術(shù)會議,結(jié)果發(fā)現(xiàn)雖占比有所提升,但這個群體的女性名額依然不足,比例為18%左右。根據(jù)我們的調(diào)查,AI存在的這種性別不平衡體現(xiàn)在了產(chǎn)業(yè)和學(xué)術(shù)兩方面:我們的數(shù)據(jù)表明學(xué)術(shù)界19% 的會議作者為女性,而產(chǎn)業(yè)界的女性作者占比為16%。
考慮到機器學(xué)習(xí)潛在的廣泛社會影響,女性在AI開發(fā)和部署方面的參與度是個重要問題。Facebook AI研究實驗室負(fù)責(zé)人Joelle Pineau教授闡明了要增加本領(lǐng)域女性數(shù)量的理由:“相對于其他領(lǐng)域我們肩負(fù)著更多的科學(xué)責(zé)任,因為我們正在開發(fā)會影響很大一部分比例人口的技術(shù)?!監(jiān)penAI的CEO Sam Altman也提出了類似的觀點,稱機器學(xué)習(xí)在博士畢業(yè)生的性別方面是“目前我所知道的最扭曲的領(lǐng)域”,同時又是“對我們未來所生活的世界會產(chǎn)生最大影響的領(lǐng)域”。
據(jù)斯坦福大學(xué)發(fā)布的2018年AI指數(shù)報告,女性在學(xué)習(xí)AI和機器學(xué)習(xí)課程的大學(xué)生當(dāng)中的占比也不足:學(xué)習(xí)斯坦福2017年的《AI導(dǎo)論》課程的74%為男性學(xué)生,加州大學(xué)伯克利分校的比例則是73%。報讀《機器學(xué)習(xí)導(dǎo)論》的女性占比甚至更低,斯坦福大學(xué)這門課程男學(xué)生占到了76%,而加州大學(xué)伯克利分校同樣課程的男學(xué)生占比更是高達79%。同一份報告還發(fā)現(xiàn),美國絕大部分AI職位的申請者都是男性(71%)。
此次調(diào)查的數(shù)據(jù)表明,不同國家/地區(qū)之間的性別差距各不相同。女性作者占比高于18%的平均水平的國家/地區(qū)包括西班牙(26%)、臺灣(23%)、新加坡(23%)、中國大陸(22%)、澳大利亞(22%)、美國(20%)、瑞士(19%)。在絕對數(shù)量上,美國的女性作者數(shù)量最多,其后是中國、英國、德國、加拿大、法國、澳大利亞、印度、意大利與新加坡。
培養(yǎng)出頂級AI專家的國家在雇用人才方面也領(lǐng)先
來自美國、中國、英國、德國、加拿大的作者占了72%
我們的會議研究人員數(shù)據(jù)讓我們得以觀察論文作者是在哪里接受培訓(xùn)的。首先,在培養(yǎng)AI人才方面,美國繼續(xù)領(lǐng)先優(yōu)勢:在這份調(diào)查的會議作者樣本中,44%的作者的博士學(xué)位是在美國獲得的。而在中國受訓(xùn)的作者占到了約11%,其后是英國(6%),德國(5%)以及加拿大、法國和日本(均為4%)。
雇用數(shù)據(jù)也顯示出了類似的地理分布特征。我們的調(diào)查表明,美國雇主繼續(xù)吸引研究人員前往工作,樣本數(shù)據(jù)中46%的人替美國的雇主工作,中國排名第二,占比為11%,第三的英國占比為7%。加拿大、德國、日本各占樣本的4%。排名前18的國家就占到了作者總量的94%。而排名前5的國家美國、中國、英國、德國、加拿大的占比達到了72%。
會議樣本絕大部分都是學(xué)術(shù)界的(77%),23%在產(chǎn)業(yè)界工作。盡管業(yè)界一些最大的私營公司仍繼續(xù)吸引人才入駐其總部,但我們也看到很多公司開始招聘專家讓他們在母國的辦公地點工作。這份報告也把這些人看成是為公司總部所在國工作。比如說,某人是在法國修得博士然后在Google的法國分公司工作,報告會把此人看成是在法國受訓(xùn)為美國公司工作。所以在統(tǒng)計方面美國受益是最大的。
為他人做嫁衣——培養(yǎng)博士的國家未必總是受益
人才流動情況
左側(cè):在哪里獲得博士學(xué)位;右側(cè):在哪里工作
本次的會議數(shù)據(jù)還分析了研究人員在完成博士學(xué)業(yè)后去到了哪里工作??傮w而言,我們發(fā)現(xiàn)在樣本當(dāng)中將近有1/3(27%)的研究人員工作的雇主所在國家跟他們接受培訓(xùn)所在的國家是不一樣的。在作者數(shù)量至少在150以上的國家當(dāng)中,這個比例甚至高達32%。這些人才流動的全球地圖很復(fù)雜,背后的故事當(dāng)然是跟個人密切相關(guān)的。但無論如何,這一數(shù)據(jù)能讓我們對AI人才的跨境流動一探端倪。(編者注:從中國的人才流入和流出來看,我們還是凈流入的多;而美國流入流出的體量都很大)
首先,我們的數(shù)據(jù)表明,某些國家對機器學(xué)習(xí)領(lǐng)域的研究人員特別有吸引力??偛吭诿绹墓椭魑M馐苡?xùn)研究人員的幾率最高。中國是吸引在別國拿到博士學(xué)位的研究人員可能性第二大的國家,在吸引的研究人員數(shù)量上幾乎是美國的1/4。我們估計會有若干因素對此產(chǎn)生影響,其中就包括每個國家的相關(guān)職位情況。
其中人才流入大于流出的10個國家/地區(qū)是:中國臺灣、瑞典、韓國、西班牙、美國、瑞士、中國、日本、英國、澳大利亞。而在接受海外專家方面的贏家是瑞士和瑞典,外來人才占比分別達到了50%和49%。
不同國家人才流入流出情況對比
這一數(shù)據(jù)還可以讓我們對比每個國家/地區(qū)的人才流入流出情況。人才流入表示的是在x國/地區(qū)工作但是在y國/地區(qū)拿到博士學(xué)位的人數(shù)除以x國/地區(qū)的AI人才總數(shù)。這個指標(biāo)可以用來衡量一個生態(tài)體系對人才的吸引力。
四象限:左上——錨定國;左下——生產(chǎn)國;右上——邀請國;右下:平臺國
另一方面,人才流出表示的是在x國/地區(qū)拿到博士學(xué)位但現(xiàn)在為y國/地區(qū)的雇主工作的人數(shù),再除以x國/地區(qū)的AI人才總數(shù)。這個比例可以看出一個國家/地區(qū)留住人才的能力。
跟平均水平相比,澳大利亞、西班牙、中國臺灣的流入情況要大于流出。這意味著這些國家/地區(qū)在挽留自己培養(yǎng)的人才并吸引外來人才方面相對更加成功。這些生態(tài)體系我們稱之為邀請國。相反,法國、以色列這樣的國家屬于生產(chǎn)國,因為跟平均水平相比,其人才流出要高于人才流入,但是差距并不大。
美國的人才流入和流出情況都相對較少。這并不能反映出其人才庫的深度:就絕對數(shù)字而言,美國依然是全球領(lǐng)先的人才磁石。相反,它反映的是人才庫的相對穩(wěn)定性。中國、德國、印度、意大利、日本和韓國也呈現(xiàn)出相同的模式。這類國家我們稱之為錨定國。
最后,還有好幾個國家的人才流入和流出都高于平均水平。這些國家成功地吸引了海外培養(yǎng)的人才,同時期研究生流動也高于平均水平。這些生態(tài)體系我們稱之為平臺國。,其中包括了加拿大、荷蘭、新加坡、瑞士以及英國。
我們的會議數(shù)據(jù)還發(fā)現(xiàn)一些國家之間的人才交流引人關(guān)注。中美之間的交流尤其突出,所以整體而言誰都沒有占太大的便宜:我們發(fā)現(xiàn)在我們的22400名研究人員數(shù)據(jù)集當(dāng)中有約500位是在中國拿得到博士學(xué)位然后為美國雇主工作的,不過也有約500名字美國拿到博士學(xué)位的人為中國的雇主工作。美國與英國之間也有類似的現(xiàn)象。
重大影響研究:美國、中國、英國、澳大利亞、加拿大領(lǐng)先
今年的調(diào)查還發(fā)現(xiàn)在頂級國際學(xué)術(shù)會議上出現(xiàn)的作者數(shù)量比去年增加了19%。為了評估這些作者目前在領(lǐng)域內(nèi)的影響力,報告分析了其2017、2018兩年間出版物的被引用情況。其中有18%(約4000人)具有較為顯著的影響力。這些人也是致力于將理論付諸應(yīng)用的團隊想要爭取的對象。
而具備高影響力的作者的國家也主要集中在幾個國家,分別是美國(1095)、中國(255)、英國(140)、澳大利亞(80)以及加拿大(45)。
不過如果分析高影響力作者在本地AI人才中的占比的話,情況會有所改變。這指標(biāo)反映的是培養(yǎng)本地頂級人才的能力。這方面澳大利亞排名第一,18%的作者發(fā)表了具備重大影響的文章,其后是美國、英國和中國(均為13%),瑞士(11%)、新加坡(9%)、瑞典和西班牙(8%),以及以色列、加拿大與意大利(7%)。
總體而言,最具影響力的研究更有可能出自學(xué)術(shù)界而不是產(chǎn)業(yè)界。但是有些國家尤其如此。中國的高影響力研究是最有可能出自學(xué)術(shù)界的(90%),緊隨其后的是意大利(86%),美國(84%),德國(83%)以及中國臺灣(81%)。而來自產(chǎn)業(yè)界的占比最高的國家是法國(30%),其后是印度和以色列(29%),西班牙(28%)以及英國(27%)。
社交網(wǎng)絡(luò)數(shù)據(jù)表明更多人是自稱的AI專家
我們的會議研究人員數(shù)據(jù)表明在AI領(lǐng)域的21個頂級學(xué)術(shù)會議上發(fā)表論文的作者和論文數(shù)量均有了顯著提升。為了了解就業(yè)市場是否有同樣的情況,我們調(diào)查了全球使用最廣泛的職業(yè)社交網(wǎng)絡(luò)LinkedIn。
我們的研究對象是那些具備機器學(xué)習(xí)技術(shù)能力、若干工作經(jīng)驗,并且能夠在交叉學(xué)科環(huán)境下寫作的職場人士。搜索包括了“數(shù)據(jù)科學(xué)家”、“研究科學(xué)家”、“機器學(xué)習(xí)工程師”、“機器學(xué)習(xí)研究人員”以及“數(shù)據(jù)分析師”,而且學(xué)歷必須是博士。最后檢索出36524名符合條件的人士。相比之下,去年的數(shù)據(jù)為22064,也就是說比去年增長了66%。
跟去年,今年的調(diào)查發(fā)現(xiàn),LinkedIn上的AI專家主要集中在美國、英國、加拿大、法國以及德國。不過,增長率最快的國家是意大利、突尼斯、以色列、愛沙尼亞以及阿根廷。
從LinkedIn樣本分析來看,這些專家的主修專業(yè)各不一樣。其中計算機科學(xué)是占比最高的(28%)。而且在一些國家這個比例甚至還要大,比如法國(47%)和中國(44%)。類似地,一些國家其中一些學(xué)科的占比也比平均水平突出。比如物理專業(yè)的平均占比為9%,但在德國其占比卻高達28%。另一個例子是數(shù)學(xué)和統(tǒng)計。平均占比為18%,但以色列、美國這個數(shù)字就升到了27%,而俄羅斯更是高達35%。
不同國家的學(xué)科差異
計算機科學(xué)約占1/3,但不同國家差異很大
當(dāng)然,利用LinkedIn分析有一些問題需要注意。首先是LinkedIn上面的信息都是用戶自述的。其次,LinkedIn的代表性對一些國家來說并不足。LinkedIn自稱有44%的美國人在上面有簡歷,加拿大的占比也有38%。但俄羅斯的占比比卻只有5%,而中國更是只有3%。
不過對于使用LinkedIn活躍的國家來說,LinkedIn上面的活動能夠為AI領(lǐng)域的人才規(guī)模和興趣改變提供洞察。就本次調(diào)查而言,我們發(fā)現(xiàn)機器學(xué)習(xí)專業(yè)出現(xiàn)了顯著的提升。這有可能是反映出一個日益重視AI技能與專業(yè)知識的市場推動了人才庫的擴張。
全球的AI人才熱點
中國
從會議作者數(shù)據(jù)看,約11%的會議作者是在中國培養(yǎng)的,也有相同比例的作者是為中國雇主工作。在樣本中中國占領(lǐng)女性作者的12%,其中有14%發(fā)表了最有影響力的研究。2018年在頂級會議上發(fā)表論文的作者當(dāng)中,有13%屬于高影響力群體。
在AI方面,中國有著若干優(yōu)勢。其中包括大規(guī)模的數(shù)據(jù),具有活力的創(chuàng)業(yè)環(huán)境,政府支持等。根據(jù)清華大學(xué)2018年6約發(fā)布的《中國人工智能發(fā)展報告》,中國在論文總量和高被引論文數(shù)量上都排在世界第一,中國已經(jīng)成為全球人工智能專利布局最多的國家,風(fēng)險投資上,中國人工智能領(lǐng)域的投融資占到了全球的60%,成為全球最“吸金”的國家。但是,在頂級AI人才這個關(guān)鍵方面占比較低(排名依次是美國、英國、德國、法國、意大利和中國)。而在人才總量,方面,該報告認(rèn)為中國僅次于美國。但是有跡象表明中美之間的差距很快就會縮?。篈llen Institute for Artificial Intelligence(艾倫人工智能研究所)最近的一項研究發(fā)現(xiàn),到2020年,中國的高影響力出版物就將超過美國。這也許就是中國的AI戰(zhàn)略將培養(yǎng)頂級人才列為優(yōu)先事項的原因之一。
這項戰(zhàn)略的部分內(nèi)容似乎是將海外工作的中國研究人員帶回中國,在提供杰出研究崗位、獎金補貼的激勵下,成功地吸引了成千上萬的研究人員將自己的工作帶到中國,其中絕大部分都是來自美國。與此同時,中國還建設(shè)了超過300座“創(chuàng)業(yè)園區(qū)”,讓海外學(xué)生和人員回國。
來自美國國家科學(xué)基金會的數(shù)據(jù)表明,相對于之前,稱學(xué)成后愿意留下來的在美國獲得數(shù)學(xué)或者計算機科學(xué)博士學(xué)位的中國博士生占比下降了。2012至2015年期間,中國學(xué)生占到了非美國籍的赴美留學(xué)博士生的42%,其中有87%的人說打算留下來,說絕對要留下來的比例也有57%。盡管表示學(xué)成后要留在美國的中國學(xué)生的占比仍高于世界平均水平,但相對于2004到07年期間,這兩個數(shù)字實際上是下降了,那段時間表達留下來意愿的占比為91%,說絕對會留下來的占到了65%。這些數(shù)據(jù)表明,在美國修完數(shù)學(xué)和計算機科學(xué)博士學(xué)位的海歸正在越來越多。
像國內(nèi)這樣的人才招募計劃,再加上AI領(lǐng)域空前的投資所帶來的商業(yè)機會,正在成為部分研究人員考慮將實驗室遷往中國的激勵因素。另一個考慮因素是所謂的“竹子天花板”:亞裔的STEM畢業(yè)生得到外國公司的雇用可能很容易,但是晉升卻不能像部分同事那么容易。2015年對Google、惠普、英特爾、LinkedIn以及Yahoo進行的一項雇用數(shù)據(jù)研究表明,盡管亞裔占到這些公司專業(yè)勞動力的27%,但主管的占比卻只有14%。
美國
在超過36500份LinkedIn簡歷的樣本里面,有將近一半(15747)是在美國的。其中很大一部分(約20%)目前或者之前在微軟(1077)、IBM(667)、Google(697)、Amazon(511)以及或者蘋果(393)工作。這些簡歷當(dāng)中87%都有至少6年的經(jīng)驗,而且?guī)缀跞迹?7%)稱有至少3年的經(jīng)驗。這個人才庫當(dāng)中約有1/3都是在舊金山灣區(qū)工作。
在會議數(shù)據(jù)方面,美國幾乎在每一個指標(biāo)的絕對數(shù)方面都是領(lǐng)先的。在美國受教育的人占到了樣本論文作者的將近一半(44%)。受雇美國公司或大學(xué)的占比達到了46%。在女性群體扎伊占比甚至更高:數(shù)據(jù)集的的4085名女性當(dāng)中,有1960(48%)是為美國雇主工作的。在美國機構(gòu)工作的高影響力(論文被引用數(shù)排名靠前)作者占到了60%。高影響力人才占到了美國AI人才的13%。其中學(xué)術(shù)家占領(lǐng)84%,產(chǎn)業(yè)界占16%。
美國在若干指標(biāo)領(lǐng)先并不出奇。一方面,美國在基礎(chǔ)AI研究上依舊領(lǐng)先。據(jù)李開復(fù)的說法,美國致力于在未來30到40年維持“研究領(lǐng)導(dǎo)力”和研究生教育方面的全球領(lǐng)先優(yōu)勢。
此外,美國公司和美國政府在AI研發(fā)方面的投入很大。Facebook、蘋果、微軟、Google和Amazon這些美國巨頭均在機器學(xué)習(xí)方面加倍下注。OECD 2018年12月發(fā)布的一份報告稱,無論是從交易額和交易數(shù)量來看,自從2011年以來,絕大部分的AI初創(chuàng)企業(yè)股權(quán)投資都流向美國公司。美國軍方也在積極投入AI研究:比方說DARPA在2018年11月就宣布未來5年投入20億美元用于“創(chuàng)造第三波AI技術(shù)潮的新老計劃”。
結(jié)論
我們的2019 全球AI人才報告表明,過去一年,AI領(lǐng)域的作者數(shù)、具有重大影響的科學(xué)論文數(shù)、以及自稱的AI專家數(shù)均有了顯著提升。不過女性的名額依舊不足,但有一些國家在性別均衡方面表現(xiàn)得更加出色。從人才分布的地緣情況看,美國在幾乎每一個指標(biāo)的絕對數(shù)方面都是領(lǐng)導(dǎo)者。但這個領(lǐng)域無疑是非常國際化的,每一個本地生態(tài)體系都有獨特的優(yōu)勢和戰(zhàn)略。專注于培養(yǎng)這一領(lǐng)域?qū)I(yè)人士的國家正在幫助將AI人才庫的蛋糕做大,從而推動本領(lǐng)域向前發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )