浏览全部资源
扫码关注微信
1. 中国电信股份有限公司广州研究院,广东 广州 510630
2. 广东工业大学计算机学院,广东 广州 510006
3. 广州优亿信息科技有限公司,广东 广州 510630
[ "陈康(1972-),男,中国电信股份有限公司广州研究院大数据应用研发中心副总经理、高级工程师,主要研究方向为分布式计算、数据挖掘和机器学习。" ]
[ "付华峥(1989-),女,现就职于中国电信股份有限公司广州研究院,主要从事数据分析、数据挖掘以及大数据相关技术等方面的研究工作。" ]
[ "陈翀(1979-),女,中国电信股份有限公司广州研究院工程师,主要研究方向为电信IT系统研发以及数据应用等,目前专注于大数据相关技术的研究与应用。" ]
[ "张宇艺(1991-),男,广东工业大学计算机学院硕士生,主要研究方向为数据挖掘、智能计算、大数据应用。" ]
[ "韦誉(1991-),男,广州优亿信息科技有限公司大数据工程师,主要研究方向为数据挖掘、大数据应用。" ]
网络出版日期:2016-12,
纸质出版日期:2016-12-20
移动端阅览
陈康, 付华峥, 陈翀, 等. 基于DPI的用户兴趣实时分类[J]. 电信科学, 2016,32(12):109-115.
Kang CHEN, Huazheng FU, Chong CHEN, et al. A real time approach to user interest classification using DPI[J]. Telecommunications science, 2016, 32(12): 109-115.
陈康, 付华峥, 陈翀, 等. 基于DPI的用户兴趣实时分类[J]. 电信科学, 2016,32(12):109-115. DOI: 10.11959/j.issn.1000-0801.2016304.
Kang CHEN, Huazheng FU, Chong CHEN, et al. A real time approach to user interest classification using DPI[J]. Telecommunications science, 2016, 32(12): 109-115. DOI: 10.11959/j.issn.1000-0801.2016304.
近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商研究的热点。设计了一种基于混合n-gram特征的URL分类算法和基于Doc2Vec模型的文本分类算法相结合的DPI数据分类方法,大大提高了DPI数据的分类速度和分类准确率,为电信运营商进行精准营销提供了良好的基础。
In recent years
with the rapid development of internet
telecom operators can gather more and more DPI data. How to mine and classify huge amounts of DPI data in real time is the key point. A DPI data classification method was presented
which combined the URL classification model based on mixed n-gram features and the Doc2Vec based text classification algorithm. The DPI data classification speed and classification accuracy were greatly improved
and good support for precise marketing was provided.
罗忆祖 . DPI技术助力运营商精细化运营 [J ] . 电信网技术 , 2009 ( 3 ): 22 - 24 .
LUO Y Z . DPI helps operators refinement operation [J ] . Telecommunication Network Technology , 2009 ( 3 ): 22 - 24 .
ABRAMSON M , AHA D W . Whatˊs in a URL? Genre classification from URLs [J ] . Workshops at the Twenty , 2012 .
边凌燕 , 贺仁龙 , 姚晓辉 . 于DPI数据挖掘实现URL分类挂载的相关技术研究 [J ] . 电信科学 , 2013 , 29 ( 11 ): 6 - 11 .
BIAN L Y , HE R L , YAO X H . Research on URL classification with DPI data mining and related technology [J ] . Telecommunications Science , 2013 , 29 ( 11 ): 6 - 11 .
朱丽娜 . 中文网页分类特征提取方法研究 [D ] . 北京 : 中国石油大学 , 2009 .
ZHU L N . Research of feature selection for Chinese Web page categorization [D ] . Beijing : China University of Petroleum , 2009 .
KAN M Y , THI H O N . Fast webpage classification using URL features [C ] // 14th ACM international conference on Information and knowledge management , October 31 - November 5 , 2005 , New York, USA . New York : ACM Press , 2005 : 325 - 326 .
汪光庆 . 基于SVM的网页分类技术研究 [D ] . 北京 : 中国石油大学 , 2011 .
WANG G Q . The research of Web pages classification based on SVM technique [D ] . Beijing : China University of Petroleum , 2011 .
陈燃燃 . 基于SVM算法的Web分类研究与实现 [D ] . 北京 : 北京邮电大学 , 2009 .
CHEN R R . Research and implementation of Web classification based on SVM algorithm [D ] . Beijing : University of Posts and Telecommunications , 2009 .
苏金树 , 张博锋 , 徐昕 . 基于机器学习的文本分类技术研究进展 [J ] . 软件学报 , 2006 , 17 ( 9 ): 1848 - 1859 .
SU J S , ZHANG B F , XU X . Advances in machine learning based text categorization [J ] . Journal of Software , 2006 , 17 ( 9 ): 1848 - 1859 .
BERNERS-LEE T , MASINTER L , MCCAHILL M . RFC 1738:uniform resource locator [J ] . Internet Engineering Task Force , 1994 .
余小军 , 刘峰 , 张春 . 基于n-gram文本特征提取的改进算法 [J ] . 现代计算机 , 2012 ( 23 ): 3 - 7 .
YU X J , LIU F , ZHANG C . Improved text feature extraction algorithm based on n-gram [J ] . Modem Computer , 2012 ( 23 ): 3 - 7 .
郑霖 , 徐德华 . 基于改进TFIDF算法的文本分类研究 [J ] . 计算机与现代化 , 2014 ( 9 ): 6 - 9 .
ZHENG L , XU D H . Research on text categorization based on improved TFIDF algorithm [J ] . Computer and Modernization , 2014 ( 9 ): 6 - 9 .
LE Q V , MIKOLOV T . Distributed representations of sentences and documents [J ] . Computer Science , 2014 ( 14 ): 1188 - 1196 .
庞观松 , 蒋胜益 . 文本自动分类技术研究综述.情报理论与实践 [J ] . 信息学:理论与应用 , 2012 , 35 ( 2 ): 123 - 128 .
PAND G S , JIANG S y . A survey of automatic text classification techniques [J ] . Information Studies: Theory & Application , 2012 , 35 ( 2 ): 123 - 128 .
0
浏览量
811
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构