×

掃碼關(guān)注微信公眾號(hào)

中譯語通展示格物多語言大模型技術(shù)和工業(yè)實(shí)踐

2023/7/27 17:15:47      砍柴網(wǎng)

2023年7月18日至20日,第二屆自然語言生成與智能寫作大會(huì)(NLGIW 2023)在新疆烏魯木齊召開。中譯語通科技股份有限公司(簡稱“中譯語通”)作為大會(huì)戰(zhàn)略合作伙伴,向與會(huì)嘉賓展示了公司格物大模型技術(shù)和工業(yè)實(shí)踐。會(huì)議還匯聚了騰訊AI Lab、百度等科技企業(yè),學(xué)術(shù)界和工業(yè)界的研究學(xué)者與從業(yè)人員,分享各自研究成果和實(shí)踐經(jīng)驗(yàn),推動(dòng)了大模型和自然語言生成領(lǐng)域的技術(shù)創(chuàng)新與研究成果轉(zhuǎn)化。


image.png


中譯語通作為NLGIW戰(zhàn)略合作伙伴參會(huì)展示

本屆會(huì)議組織單位為中國中文信息學(xué)會(huì)自然語言生成與智能寫作專業(yè)委員會(huì)(籌),承辦單位為新疆師范大學(xué)。大會(huì)從特邀報(bào)告、講習(xí)班、青年學(xué)者論壇等各個(gè)環(huán)節(jié)圍繞自然語言生成與大模型展開,包括大語言模型、代碼大模型、多模態(tài)大模型的基本原理、高效訓(xùn)練和推理、有監(jiān)督微調(diào)、人類反饋學(xué)習(xí)、安全與倫理、大模型應(yīng)用等各個(gè)維度開展,為參與者提供一場關(guān)于大模型的盛宴。


image.png


NLGIW專委主任委員

兼中譯語通2030人工智能研究院院長

趙鐵軍教授出席開幕式并致辭

會(huì)議邀請(qǐng)到了中科院自動(dòng)化所宗成慶研究員、華為諾亞方舟實(shí)驗(yàn)室劉群教授、哈爾濱工業(yè)大學(xué)秦兵教授三位知名專家做大會(huì)特邀報(bào)告。這些報(bào)告簡要回顧了生成式語言模型“前世”的基礎(chǔ)上,對(duì)大語言模型的“今生”做了簡要分析,系統(tǒng)性地介紹了知識(shí)增強(qiáng)的語言模型技術(shù)和研究進(jìn)展,以及從大模型的安全角度出發(fā),探索了大模型安全性內(nèi)容生成的方法,包括研究大模型辨別是非能力,以及人類普世價(jià)值觀,社會(huì)文化價(jià)值觀及立場對(duì)齊上的內(nèi)容檢測與生成方法,探索AI社會(huì)協(xié)作式的價(jià)值觀對(duì)齊機(jī)制。


image.png


中譯語通2030人工智能研究院副院長陳自巖進(jìn)行報(bào)告發(fā)言

在企業(yè)論壇環(huán)節(jié)中,中譯語通2030人工智能研究院副院長陳自巖博士受邀進(jìn)行題為《格物多語言大模型技術(shù)和工業(yè)實(shí)踐》的發(fā)言,針對(duì)當(dāng)前人工智能在工業(yè)實(shí)踐中面臨的多語言間語義割裂、從數(shù)據(jù)+需求到應(yīng)用的端到端的迫切需求、社交交互生成難以達(dá)到擬人化程度等挑戰(zhàn),闡述了中譯語通基于格物大模型解決這些難題的創(chuàng)新技術(shù)和成功實(shí)踐。

格物大模型是中譯語通于2022年11月發(fā)布的大模型體系,包括了多語言預(yù)訓(xùn)練模型、多語言機(jī)器翻譯超大模型、多模態(tài)預(yù)訓(xùn)練模型等。陳自巖博士還重點(diǎn)介紹了公司正在研發(fā)的新一代多語言生成式對(duì)話大模型,該模型以自有的近80億句對(duì)高質(zhì)量平行語料、100多個(gè)語種的PB級(jí)數(shù)據(jù)為基礎(chǔ),融合上下文理解、個(gè)性化、思維鏈等高達(dá)2000萬規(guī)模的高質(zhì)量業(yè)務(wù)化指令,并提出領(lǐng)域?qū)<覍?duì)齊和社交對(duì)抗反饋的混合強(qiáng)化學(xué)習(xí)技術(shù),旨在打造時(shí)效性較高、千人千面的生成式大模型。

目前公司研發(fā)的生成式大模型已在多語言知識(shí)圖譜端到端生成、社交媒體行為生成、領(lǐng)域報(bào)告寫作等應(yīng)用場景實(shí)現(xiàn)了落地應(yīng)用,同時(shí)針對(duì)全球防務(wù)安全、科研數(shù)據(jù)分析、智慧城市和全球戰(zhàn)略數(shù)據(jù)研究等領(lǐng)域進(jìn)行全方位技術(shù)革新。此外,陳自巖博士與騰訊、百度等企業(yè)專家圍繞大模型在應(yīng)用落地上的難點(diǎn)和應(yīng)對(duì)措施進(jìn)行圓桌討論。


image.png


中譯語通2030人工智能研究院副院長

陳自巖(左四)代表公司領(lǐng)獎(jiǎng)

會(huì)議上,中國中文信息學(xué)會(huì)自然語言生成與智能寫作專委會(huì)為中譯語通等8家企業(yè)頒發(fā)感謝獎(jiǎng)牌,表達(dá)各企業(yè)對(duì)本屆大會(huì)的特別支持。


image.png


會(huì)議現(xiàn)場


image.png


中譯語通現(xiàn)場展示多語種自然語言處理算法成果