MSCBSC 移動(dòng)通信論壇
搜索
登錄注冊(cè)
網(wǎng)絡(luò)優(yōu)化工程師招聘專欄 4G/LTE通信工程師最新職位列表 通信實(shí)習(xí)生/應(yīng)屆生招聘職位

  • 閱讀:552
  • 回復(fù):0
蘋(píng)果官方宣布將設(shè)置人工智能程序攔截垃圾信息
mao_mao
論壇副管
鎵嬫満鍙風(fēng)爜宸查獙璇? style=


 發(fā)短消息    關(guān)注Ta 

C友·鐵桿勛章   管理·勤奮勛章   C友·進(jìn)步勛章   管理·優(yōu)秀勛章   C友·貢獻(xiàn)勛章   “灌水之王”   紀(jì)念勛章·七周年   管理·標(biāo)兵勛章   活動(dòng)·積極勛章   財(cái)富勛章·財(cái)運(yùn)連連   財(cái)富勛章·大富豪   財(cái)富勛章·小財(cái)主   專家·終級(jí)勛章   財(cái)富勛章·神秘富豪   C友·登錄達(dá)人   紀(jì)念勛章·五周年   財(cái)富勛章·富可敵國(guó)   財(cái)富勛章·財(cái)神   財(cái)富勛章·富甲一方   財(cái)富勛章·鉆石王老五   活動(dòng)·第二屆通信技術(shù)杯   紀(jì)念勛章·六周年   活動(dòng)·攝影達(dá)人   紀(jì)念勛章·八周年   紀(jì)念勛章·九周年   紀(jì)念勛章·十周年   C友·技術(shù)大神  
積分 428896
帖子 85070
威望 5335291 個(gè)
禮品券 5423 個(gè)
專家指數(shù) 3546
注冊(cè) 2009-4-24
專業(yè)方向  移動(dòng)通信
回答問(wèn)題數(shù) 0
回答被采納數(shù) 0
回答采納率 0%
 
發(fā)表于 2018-08-13 16:34:58  只看樓主 

  [環(huán)球網(wǎng)科技 記者 樊俊卿]七夕將至,你是否收到過(guò)電商店鋪推送的打折促銷(xiāo)短信?平時(shí)是否經(jīng)常收到理財(cái)、貸款、購(gòu)房等信息?如果你是蘋(píng)果用戶,那你是否有過(guò)半夜收到iMessage推送賭場(chǎng)、假貨、股票以及色情信息的經(jīng)歷?

  商家給安卓用戶推送廣告信息需要通過(guò)移動(dòng)、聯(lián)通等運(yùn)營(yíng)商,運(yùn)營(yíng)商會(huì)攔截掉一些非法信息,而針對(duì)蘋(píng)果用戶,商家甚至不法分子則可利用iMessage渠道通過(guò)互聯(lián)網(wǎng)直接向用戶推送垃圾信息,目前蘋(píng)果公司尚未采取有效的篩選、攔截等手段。

  近日有外媒曝光稱,蘋(píng)果官方發(fā)布聲明,表示正在探索更先進(jìn)的機(jī)器學(xué)習(xí)模型識(shí)別,過(guò)濾垃圾信息。

  作為人工智能的核心技術(shù),機(jī)器學(xué)習(xí)是計(jì)算機(jī)模擬人類(lèi)思考方式的一種學(xué)習(xí)行為,它讓計(jì)算機(jī)變得“聰明伶俐”。“基于機(jī)器學(xué)習(xí)的垃圾信息過(guò)濾技術(shù)實(shí)際上是一個(gè)二元分類(lèi)過(guò)程,機(jī)器學(xué)習(xí)模型需回答‘是’或‘不是’,以便將垃圾文本從大量信息中分離出來(lái)!北本┱Z(yǔ)言大學(xué)大數(shù)據(jù)與語(yǔ)言教育研究所所長(zhǎng)荀恩東教授表示,“首先應(yīng)準(zhǔn)備人工標(biāo)注的數(shù)據(jù),進(jìn)而構(gòu)建機(jī)器學(xué)習(xí)參數(shù)化模型,最后對(duì)其訓(xùn)練、測(cè)試,直至模型應(yīng)用,解決實(shí)際問(wèn)題!

  “目前市場(chǎng)上識(shí)別垃圾郵件、短信的機(jī)器學(xué)習(xí)模型絕大部分采用的是針對(duì)文本顯式特征的分析和提取。”荀恩東解釋,所謂“顯式”特征,是指垃圾信息的關(guān)鍵詞、表達(dá)形式、特殊符號(hào)、異體字、敏感詞語(yǔ)表達(dá)方式等“外在”特征。將這些多元、離散的特征元素匯總,便可構(gòu)成顯式特征列表,進(jìn)而構(gòu)建模型對(duì)垃圾信息進(jìn)行甄別。

  “這種分類(lèi)方式效率較高、成本較低、所依賴數(shù)據(jù)較少,但也存在適應(yīng)性差,識(shí)別精度不高等不足之處!避鞫鳀|指出,如果垃圾信息發(fā)送方掌握了用戶攔截系統(tǒng)的顯式特征列表,便可對(duì)垃圾信息的敏感詞匯作出相應(yīng)調(diào)整,變換表達(dá)形式,從而有效規(guī)避攔截系統(tǒng)。因此分類(lèi)器需要實(shí)時(shí)動(dòng)態(tài)更新顯式特征列表,即便如此,該列表元素?cái)?shù)量也十分有限,導(dǎo)致分類(lèi)器過(guò)濾效果不佳,精確度不高。

  基于顯式特征的分類(lèi)方式“先天不足”,蘋(píng)果公司有可能將目光投向隱式特征分類(lèi),即深度學(xué)習(xí)模型。荀恩東表示,深度學(xué)習(xí)模型可對(duì)海量數(shù)據(jù)的信息進(jìn)行深度挖掘,從信息的語(yǔ)義和內(nèi)容上對(duì)垃圾信息進(jìn)行甄別。也就是說(shuō),同樣一條推銷(xiāo)短信,深度學(xué)習(xí)模型基于龐大的數(shù)據(jù)庫(kù),可分析出它的多種表達(dá)方式,從而做出更加準(zhǔn)確的判斷,僅靠改變文字形式無(wú)法逃脫深度學(xué)習(xí)模型的“火眼金睛”。深度學(xué)習(xí)模型省去了前期建立大量顯示特征列表的工作,只需標(biāo)注垃圾、非垃圾信息即可,不僅效率提高,識(shí)別精度也得到很大提升。

  基于深度學(xué)習(xí)的垃圾信息過(guò)濾技術(shù)目前也面臨諸多技術(shù)難點(diǎn)。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院張軍平教授表示,雖然有大數(shù)據(jù)支撐,深度學(xué)習(xí)模型在很多方面還是無(wú)法像人一樣有效分析和理解信息中的內(nèi)容。例如,個(gè)別漢字的順序顛倒不一定能影響閱讀,然而深度學(xué)習(xí)模型并沒(méi)有人腦這樣“聰明”。另外,組合爆炸問(wèn)題也是難點(diǎn)之一。垃圾信息涉及領(lǐng)域廣泛,形式變化多端,大數(shù)據(jù)深度學(xué)習(xí)模型可能對(duì)已有的垃圾信息有效分類(lèi),但面對(duì)新出現(xiàn)的垃圾信息可能就會(huì)“蒙圈”。

  “這需要借助類(lèi)似長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)或更新的一些技術(shù),對(duì)深度學(xué)習(xí)模型進(jìn)行定期更新! 張軍平認(rèn)為,還可以考慮自然語(yǔ)言處理中的一些句與句的關(guān)系,進(jìn)一步完善深度學(xué)習(xí)算法,從而改善其預(yù)測(cè)、分類(lèi)能力。


掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5G NTN技術(shù)白皮書(shū)
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《 R16 23501-g60 5G的系統(tǒng)架構(gòu)1
  • 對(duì)本帖內(nèi)容的看法? 我要點(diǎn)評(píng)

     
    [充值威望,立即自動(dòng)到帳] [VIP貴賓權(quán)限+威望套餐] 另有大量?jī)?yōu)惠贈(zèng)送活動(dòng),請(qǐng)光臨充值中心
    充值擁有大量的威望和最高的下載權(quán)限,下載站內(nèi)資料無(wú)憂

    快速回復(fù)主題    
    標(biāo)題
    內(nèi)容
     上傳資料請(qǐng)點(diǎn)左側(cè)【添加附件】

    當(dāng)前時(shí)區(qū) GMT+8, 現(xiàn)在時(shí)間是 2025-01-23 06:09:12
    渝ICP備11001752號(hào)  Copyright @ 2006-2016 mscbsc.com  本站統(tǒng)一服務(wù)郵箱:mscbsc@163.com

    Processed in 0.546220 second(s), 16 queries , Gzip enabled
    TOP
    清除 Cookies - 聯(lián)系我們 - 移動(dòng)通信網(wǎng) - 移動(dòng)通信論壇 - 通信招聘網(wǎng) - Archiver