0833-2303365

當前位置:
· 智能四季溫室解決(jué)方案
來源: | 作者:tpl-c50633d | 發布時間: 2020-10-23 | 298 次瀏覽 | 分享到:
(以下為臨時文(wén)案,您可自由進行更換)自然語言處理是計算機(jī)科學(xué)領域與人工智能領域中的(de)一個重要方向。它研究能(néng)實現人與(yǔ)計算機(jī)之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門(mén)融語言學、計算機科學、數學於一體的(de)科(kē)學。因此(cǐ),這一領域的研究將涉及自然語言,即人們日常使用的語言(yán),所以它與語言學的研究有著密切的聯係,但又有重要的區別。自然(rán)語言處理並不是一般地研究自然語(yǔ)言,而(ér)在(zài)於(yú)研製能有(yǒu)效地實現自然(rán)語言通信的計算機係統,特(tè)別是其中的軟件係統。因而它是計算機科學的一部分。
自然語言處理(NLP)是計算機科學,人工智能,語言(yán)學關注計(jì)算機和人(rén)類(lèi)(自然)語言之間的相互作用(yòng)的領域(yù)。

語言是(shì)人類區別其(qí)他動(dòng)物的本質特性。在所有生物中,隻有人類才具有語言能力。人(rén)類的多種智能(néng)都與語(yǔ)言有著密切的(de)關係。人類(lèi)的邏輯(jí)思維以語言為形式,人類的絕大部分知識(shí)也是以語言文(wén)字的形式記載和流(liú)傳下來的(de)。因而,它也是(shì)人工智(zhì)能的一個重要,甚至核心部分。
用(yòng)自然(rán)語言與計算機(jī)進行通信,這是人們長期以來所追求的。因(yīn)為它(tā)既有明顯的實際意義,同時也有重要的理論意義:人們可以用自(zì)己較習慣的語言來使用計算機(jī),而(ér)無需再花大量(liàng)的時間(jiān)和精力去學習不(bú)很自然和習慣的(de)各種計算機語言;人們也可(kě)通過它進一步了解人(rén)類的語言能力和智能的機製。
實現人機間(jiān)自然語言(yán)通信(xìn)意味著要使計(jì)算機既能理解自然語(yǔ)言文本的意義,也能以自然語言文本來表達給定的意圖、思想等。前者稱為自(zì)然(rán)語言理(lǐ)解,後者稱為自然語言生成。因此,自然語言處(chù)理大體包括了自然語言理解(jiě)和自然語言生成兩個部分。曆史上對自然語言理解研究得較多,而對自然語(yǔ)言生成研(yán)究得較少。但這種狀況已(yǐ)有所改變。
無論實現自然語(yǔ)言理解,還(hái)是自然語言生成,都遠不如人們原來想象的那麽簡單,而是**困難的。從現有的理論和技術現狀看,通(tōng)用的、高質量的自然語言處(chù)理係統,仍然是(shì)較長期的努力目(mù)標(biāo),但是針對一定應用,具(jù)有相當自然語言處理能力的實用係統已經出現,有些已商品化(huà),甚至開(kāi)始(shǐ)產業化。典型的例子有:多語種數據庫和專家係統的自然語言接口(kǒu)、各種機器翻譯係統、全(quán)文信(xìn)息檢索係統、自(zì)動文(wén)摘係統等。
自然語言處理,即實(shí)現人機間自然語言通信,或實現自然語言理解和自然語言生成是**困難(nán)的。造成困難的根本(běn)原因是自然語言文本和對話的各個層次(cì)上廣泛存在的各種各樣的(de)歧義性或多義(yì)性(ambiguity)。
一個中文文(wén)本從(cóng)形(xíng)式上(shàng)看是由漢(hàn)字(包括標點符號等)組成的一個字符串。由字可組成詞,由詞可組(zǔ)成詞組,由詞組可組(zǔ)成(chéng)句子,進而由一些句子組成段、節、章、篇。無論在上述的各種層次:字(符)、詞、詞組(zǔ)、句子、段,……還是在下一層次向上一層(céng)次轉(zhuǎn)變中都存在(zài)著歧義和多義現象,即形式上一樣的一段字符串,在不同(tóng)的場景或不同的語境下,可(kě)以(yǐ)理解成不同的詞串、詞組串等,並有(yǒu)不同的意義。一般(bān)情況下,它們中的大多數都是可以根據相(xiàng)應的語境和場景的規定(dìng)而得到解決(jué)的。也就是說,從總體上說,並不存在歧義。這也就是我(wǒ)們平時並(bìng)不感到自然語言歧義,和能用自然語言(yán)進行正確交流的原(yuán)因。但是一方(fāng)麵,我們也看到,為了消解歧義,是需要極其大量的知識和進(jìn)行推理(lǐ)的。如何將這些知識較完整地(dì)加以收集和整理出來(lái);又如何找到合適的形式,將它們存入(rù)計算機係統中去;以及如何有效(xiào)地利用它們來消除歧義,都是工(gōng)作量(liàng)極大且**困難的工作。這(zhè)不是少數人短時期內(nèi)可以(yǐ)完成的,還有待長期的、係統的工作。
以上(shàng)說的是,一個中文文本或一個漢字(含標(biāo)點符號等)串可能有多個含義(yì)。它是自然語言理解中的主要困難(nán)和障(zhàng)礙。反過來,一個相同或相近的意義同樣可(kě)以用多個中文文本或多個漢字串來表示。
因此,自然語言的形式(字符串)與其意義之間是(shì)一(yī)種多對多的關係。其實這也正是自然語言的魅(mèi)力所在。但從計(jì)算機處理的角度看,我們必須(xū)消除歧義,而且有人認為它正是自然(rán)語言理解中的中心問題,即要把帶有潛在歧義的自然(rán)語言輸(shū)入轉換成某種無歧(qí)義的計算機內部(bù)表示。
歧義現象(xiàng)的廣泛存在使得消除它們(men)需要大量的知識和推理,這就(jiù)給基於語言學的方法、基於知(zhī)識的方法帶來了巨大的(de)困難,因而(ér)以這些方法(fǎ)為主流的自然語言處理研究幾十年來一方麵在理論和方法方麵取得了很多成就,但(dàn)在能處理大(dà)規模真實文(wén)本的係統研製方麵,成績並不顯著。研製的一些係統(tǒng)大多(duō)數是小規模的、研究性的演示係統(tǒng)。
目前存在的問題有兩(liǎng)個方(fāng)麵:一方麵,迄今為止(zhǐ)的語法都限於分析一個孤立的句子(zǐ),上下文關係和談(tán)話環境對本(běn)句的(de)約束和影響還缺乏係統的研究,因此分析歧義(yì)、詞語省(shěng)略、代(dài)詞所指、同一句話在不同場合或由不同(tóng)的人說(shuō)出來所具有(yǒu)的不同含義等問題,尚(shàng)無明確規律可循,需要加強語用學的研究才能(néng)逐步解決。另一方麵,人理解一個句子不是單憑語(yǔ)法,還運用了大(dà)量(liàng)的有關知識,包括生活知識和專門知識,這些(xiē)知識無法全部貯存在(zài)計算機裏。因(yīn)此一個書(shū)麵理解係統隻能建立(lì)在有限(xiàn)的詞匯、句型和特定的主題範圍內;計算機的貯存(cún)量和運轉速度大(dà)大提高之後,才有可能適當擴大範圍.
以上存在(zài)的問題成為自然語言理解在機器翻譯應用中的主要難題,這也就是當(dāng)今機(jī)器翻(fān)譯係統的譯文質量離理想目標仍相差甚遠(yuǎn)的(de)原因(yīn)之一;而譯文質量是機譯係統成敗的關鍵。中國數學家、語言學(xué)家(jiā)周海(hǎi)中教授曾在(zài)**論文《機器翻譯五十年》中指出:要提高機譯的質量,首先要解決的是語言本身問(wèn)題而不是程序(xù)設(shè)計問題;單靠若幹程序來做機譯係統,肯(kěn)定是無法提高機譯質量的;另外在(zài)人(rén)類尚未明了大腦是如何(hé)進(jìn)行語言的模糊識別和邏輯判斷的情況下,機譯要想達到“信、達、雅(yǎ)”的程度是不可能的。
麻豆md0049免费_麻豆传媒网站_麻豆福利视频_麻豆精品_麻豆免费入口_麻豆视频官网_麻豆视频网_麻豆视频在线免费观看_麻豆网站在线_免费观看www成人A片麻豆_午夜久久无码成人免费AV麻豆婷_豆麻视频在线免费观看