

本文轉自中國科技大學新聞網(wǎng)
在信息化時代的今日,在線社交網(wǎng)絡與個人的生活密切相關。在線社交網(wǎng)絡既能促進有益信息的傳播,同時也為惡意信息的擴散提供了溫床。如何快速而準確地識別惡意信息的傳播源頭(如網(wǎng)絡謠言源、計算機病毒源),是網(wǎng)絡科學中一個重要的基礎問題。
日前,中國科大信息科學與技術學院博士生王朝旭和董文祥針對網(wǎng)絡謠言源識別問題開展了深入研究,首次發(fā)現(xiàn)利用多樣本觀察知識能夠為檢測方法帶來顯著的分集增益。運用數(shù)理統(tǒng)計理論,他們從原理上證明,利用多樣本觀察知識,對于規(guī)則樹狀網(wǎng)絡拓撲模型,能夠將正確檢測率由文獻中單樣本觀察時的30.7%提升到趨近100%。進一步地,通過對多種實際網(wǎng)絡模型的數(shù)值實驗研究,證實了他們提出的多樣本檢測算法在實際場合中,有潛力大幅度提高謠言源識別的精度。
上述研究成果以正式論文的形式在ACM SIGMETRICS會議上報告。論文由王朝旭、董文祥和他們的導師張文逸教授,以及香港城市大學計算機科學系陳志為(Chee Wei Tan)博士合作完成,中國科大電子工程與信息科學系是該論文的第一完成單位和通訊單位。創(chuàng)立于1973年的ACM SIGMETRICS是計算機系統(tǒng)性能建模、測量和分析領域的旗艦學術會議,平均錄用率僅為15%左右。此前四十余年中國大陸科研單位作為第一作者僅在該會議發(fā)表過六篇正式論文,其中中國科大在2010年由計算機學院作為第一作者發(fā)表過一篇正式論文。
中國科大學者的該成果在未來可望應用于網(wǎng)絡執(zhí)法機構進行網(wǎng)絡取證等各種網(wǎng)絡安全相關的領域,通過充分挖掘利用多個數(shù)據(jù)樣本中所包含的潛在聯(lián)合信息,快速而準確地識別出惡意信息的傳播源頭。