日前,由搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動(dòng)報(bào)名。作為國(guó)內(nèi)首檔基于大規(guī)模真實(shí)用戶問答數(shù)據(jù)集的問答評(píng)測(cè)任務(wù),此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺(tái),還將促進(jìn)學(xué)術(shù)界及業(yè)界在智能問答領(lǐng)域的研究發(fā)展,推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
此次問答比賽分為事實(shí)型問答和非事實(shí)型問答兩項(xiàng)子任務(wù)。按照賽制,參賽者需要根據(jù)給定的問題設(shè)計(jì)算法,從候選篇章中抽取合適的詞語、短語或句子,作為問題的標(biāo)準(zhǔn)答案,能夠?qū)崿F(xiàn)正確、完整、簡(jiǎn)潔地回答問題。每個(gè)問題對(duì)應(yīng)給出10個(gè)候選答案篇章,每個(gè)篇章約50 - 500個(gè)漢字。
在評(píng)測(cè)指標(biāo)方面,事實(shí)型問答子任務(wù)將采用Accuracy和Precision-Recall(F1)指標(biāo)對(duì)預(yù)測(cè)答案進(jìn)行評(píng)價(jià),其中Accuracy計(jì)算預(yù)測(cè)答案和標(biāo)準(zhǔn)答案是否精確匹配,F(xiàn)1計(jì)算預(yù)測(cè)答案相對(duì)標(biāo)準(zhǔn)答案的詞級(jí)重合度,以兩者平均值作為最終指標(biāo)。非事實(shí)型問答子任務(wù)采用ROUGE和BLEU指標(biāo)對(duì)預(yù)測(cè)答案進(jìn)行綜合評(píng)價(jià)。
據(jù)悉,此次比賽的事實(shí)型問答子任務(wù),將從9月1日起開始提交報(bào)名,有興趣參賽的高校生、業(yè)內(nèi)研究人員等,可通過“搜狗實(shí)驗(yàn)室”官網(wǎng)提交報(bào)名信息。非事實(shí)型問答子任務(wù),則將在12月中旬開始接受提交報(bào)名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學(xué)術(shù)年會(huì)上,將會(huì)對(duì)兩項(xiàng)子任務(wù)中勝出的團(tuán)隊(duì)進(jìn)行頒獎(jiǎng)。
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實(shí)用戶問答數(shù)據(jù)集。其中,6萬個(gè)問題(事實(shí)型問題3萬、非事實(shí)型問題3萬),代表了最真實(shí)廣泛的網(wǎng)民信息需求;60萬對(duì)應(yīng)問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁面;而經(jīng)過對(duì)頁面進(jìn)行人工分析標(biāo)注,搜狗搜索構(gòu)建了針對(duì)問題的標(biāo)準(zhǔn)答案,最終形成大規(guī)模、極具價(jià)值的問答數(shù)據(jù)集。
據(jù)了解,目前在智能問答研究領(lǐng)域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實(shí)用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學(xué)術(shù)界受限于技術(shù)、數(shù)據(jù)等因素,當(dāng)前的研究主要針對(duì)“事實(shí)型問答”領(lǐng)域,而在與用戶搜索場(chǎng)景息息相關(guān)的“開放域智能問答”領(lǐng)域則一直無法取得突破性進(jìn)展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進(jìn)“CIPS-SOGOU問答比賽”的正常開展,還能將給整個(gè)智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
事實(shí)上,憑借在人工智能領(lǐng)域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢(shì),搜狗搜索目前在智能問答領(lǐng)域已處于行業(yè)領(lǐng)先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術(shù)。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準(zhǔn)回答事實(shí)性問題,在分析類問題、觀點(diǎn)類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應(yīng)用了語義分析、問題理解、信息抽取、知識(shí)圖譜、信息檢索、深度學(xué)習(xí)等眾多人工智能技術(shù)。
作為智能問答領(lǐng)域的引領(lǐng)者,搜狗搜索在切實(shí)推進(jìn)產(chǎn)品落地、為用戶帶來優(yōu)質(zhì)搜索體驗(yàn)的同時(shí),也注重向行業(yè)開放問答能力,不斷推動(dòng)業(yè)界及學(xué)術(shù)界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國(guó)信息檢索學(xué)術(shù)會(huì)議)成功舉辦了國(guó)內(nèi)首次大規(guī)模真實(shí)用戶問答數(shù)據(jù)集上的問答評(píng)測(cè)任務(wù)——首屆“面向智能問答的篇章排序”評(píng)測(cè)比賽,并公開了來自用戶真實(shí)搜索需求的5萬個(gè)問題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬條候選篇章,極大促進(jìn)了智能問答技術(shù)的發(fā)展和應(yīng)用。
相比“面向智能問答的篇章排序”評(píng)測(cè)比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進(jìn)行全新升級(jí),將會(huì)在更大程度上促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流和研究水平。對(duì)此次問答評(píng)測(cè)比賽感興趣的高校生或業(yè)內(nèi)從業(yè)者,均可報(bào)名參加。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- GitLab將告別中國(guó)區(qū)用戶:是時(shí)候選擇新的“極狐”或保護(hù)賬號(hào)了
- 蘋果明年推至少22款新品,阿里非洲首站啟動(dòng),科技新品盛宴拉開帷幕
- SUSE預(yù)測(cè):未來私有AI平臺(tái)崛起,讓我們共同見證AI的未來
- AI伴侶“小奇”:奇富科技重塑金融服務(wù)體驗(yàn)的探索之作
- 揭秘軟銀孫正義神秘芯片計(jì)劃:打造超越NVIDIA的未來科技新星
- 大模型創(chuàng)企星辰資本獲數(shù)億融資,騰訊啟明等巨頭入局,人工智能新篇章開啟
- 大模型獨(dú)角獸階躍星辰融資新動(dòng)態(tài):數(shù)億美金B(yǎng)輪,揭秘星辰未來之路
- 哪吒汽車創(chuàng)始人資金遭凍結(jié),1986萬元股權(quán)風(fēng)波引關(guān)注
- 本田與日產(chǎn)醞釀合并:明年6月敲定協(xié)議,新公司社長(zhǎng)待本田推薦
- 金融大模型新突破:百川智能Baichuan4-Finance引領(lǐng)行業(yè),準(zhǔn)確率領(lǐng)先GPT-4近20%,變革金融業(yè)未來
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。