摘要:社交網(wǎng)絡(luò)中識別用戶身份具有重要價值,它對社交網(wǎng)絡(luò)的分析與監(jiān)管、用戶行為的預(yù)測以及用戶之間交互過程的研究具有重要意義.該文針對社交網(wǎng)絡(luò)中的用戶身份進(jìn)行研究,將用戶身份分為組織用戶和個人用戶,并對這兩種用戶身份進(jìn)行具體定義和識別.該文研究問題屬于社交網(wǎng)絡(luò)用戶分析研究中的子研究問題,主要通過用戶在社交網(wǎng)絡(luò)中發(fā)表的文本內(nèi)容、多媒體內(nèi)容以及用戶時間序列內(nèi)容識別出該用戶的組織-個人身份,為社交網(wǎng)絡(luò)用戶身份的識別及進(jìn)一步研究提供借鑒和幫助.在識別過程中,通過對文本內(nèi)容中用戶的口語化水平、內(nèi)容(主題)復(fù)雜化水平、內(nèi)容規(guī)范化水平的度量以及多媒體內(nèi)容中用戶圖片特性和用戶時間序列內(nèi)容的分析,從不同角度提出5種機(jī)器可操作的用戶組織-個人身份識別方法,進(jìn)而識別出社交網(wǎng)絡(luò)中用戶是組織用戶還是個人用戶.最后,為了驗(yàn)證該文所提識別方法的可行性和有效性,該文選擇新浪微博數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并通過概率模型識別方法進(jìn)行了對比分析.同時,在驗(yàn)證過程中,使用多種指標(biāo)對實(shí)驗(yàn)結(jié)果進(jìn)行評價.實(shí)驗(yàn)結(jié)果表明,該文識別方法能夠有效識別出用戶的組織-個人身份,其中內(nèi)容復(fù)雜特性識別方法、內(nèi)容規(guī)范化識別方法以及時間序列內(nèi)容識別方法的用戶身份識別準(zhǔn)確率超過80%.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
計(jì)算機(jī)學(xué)報(bào)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:研究論文與技術(shù)報(bào)告、短文、學(xué)術(shù)通信、學(xué)術(shù)活動、中國計(jì)算機(jī)學(xué)會學(xué)術(shù)動態(tài)等。于1978年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。