浏览全部资源
扫码关注微信
[ "边凌燕,女,中国电信股份有限公司上海研究院工程师,主要研究方向为数据分析、数据挖掘。" ]
[ "贺仁龙,男,中国电信股份有限公司上海研究院工程师,主要研究方向为信息管理。" ]
[ "姚晓辉,男,中国电信股份有限公司上海研究院工程师,主要研究方向为数据规划、数据挖掘、信息管理。" ]
网络出版日期:2013-11,
纸质出版日期:2013-11-20
移动端阅览
边凌燕, 贺仁龙, 姚晓辉. 基于DPI数据挖掘实现URL分类挂载的相关技术研究[J]. 电信科学, 2013,29(11):6-11.
Lingyan Bian, Renlong He, Xiaohui Yao. Research on URL Classification with DPI Data Mining and Related Technology[J]. Telecommunications science, 2013, 29(11): 6-11.
边凌燕, 贺仁龙, 姚晓辉. 基于DPI数据挖掘实现URL分类挂载的相关技术研究[J]. 电信科学, 2013,29(11):6-11. DOI: 10.3969/j.issn.1000-0801.2013.11.002.
Lingyan Bian, Renlong He, Xiaohui Yao. Research on URL Classification with DPI Data Mining and Related Technology[J]. Telecommunications science, 2013, 29(11): 6-11. DOI: 10.3969/j.issn.1000-0801.2013.11.002.
通过对DPI用户上网行为数据进行深入挖掘,实现与网页URL分类体系的归类映射,是精准锁定上网用户兴趣偏好特征的关键。在梳理DPI数据自动挂载URL分类节点流程的基础上,重点研究了过程中涉及的网页信息提取、中文分词、特征选择及文本分类等关键技术,为利用DPI数据提升客户洞察能力铺平了技术道路。
In order to achieve the precise localization of internet customers' preference
the crucial point is to catch the classified mapping of URL system through digging deep into the data of DPI users' online behavior data. Based on summarizing the process of DPI data auto classification
the key technique was investigated which involved in Web information extraction
Chinese word segmentation
feature selection
text classification and so on. It may make solid technical foundations for the customer insight with DPI data.
罗忆祖 . DPI技术力助运营商精细化运营 . 邮电设计技术 , 2009 ( 3 )
于静 . 基于页面主体提取的Web信息抽取技术研究 . 南京邮电大学硕士学位论文 , 2013
冯书晓 , 徐新 , 杨春梅 . 国内外中文分词技术研究新进展 . 情报杂志 , 2002 ( 11 ): 29 ~ 30
郭瞳康 . 基于词典的中文分词技术研究 . 哈尔滨理工大学硕士学位论文 , 2010
李原 . 中文文本分类中分词和特征选择方法研究 . 吉林大学硕士学位论文 , 2011
薛为民 , 陆玉昌 . 文本挖掘技术研究 . 北京联合大学学报(自然科学版) , 2005 , 19 ( 4 ): 59 ~ 63
宋江 . 文本分类的特征选择方法研究 . 南京航空航天大学硕士学位论文 , 2010
王法波 . 文本分类的特征选择和分类方法研究 . 山东大学硕士学位论文 , 2011
Liu H , Motoda H . Feature Extraction, Construction and Selection:A Data Mining Perspective . USA: Kluwer Academic , 1998
Jain A , Zongker D . Feature selection: evaluation, application and small sample performance . IEEE Transactions on Pattern Analysis and Machine Intelligence , 1997 ( 2 ): 153 ~ 158
Gorvan A . Principal Manifolds for Data Visualisation and Dimension Reduction . New York: Springer , 2007
Verleysen M , Lee J A . Rank-based quality assessment of nonlinear dimensionality reduction . Proceedings of the 16th European Symposium on Artificial Neural Networks , Bruges, Belgium , 2008 : 49 ~ 54
Deerwester S . Indexing by latent semantic analysis . Journal of American Society for Information Science , 1990 , 41 ( 6 ): 391 ~ 407
陈燃燃 . 基于SVM算法的Web分类研究与实现 . 北京邮电大学硕士学位论文 , 2009
Vapnik V N . The Nature of Statistical Learning Theory . New York: Springer , 1995
Joachims T . Text categorization with support vector machines:learning with many relevant features . Proceedings of the 10th European Conference on Machine Learning , Chemnitz, Germany , 1998 : 137 ~ 142
Joachims T . Transductive inference for text classification using support vector machine s . Proceedings of the 16th International Conference on Machine Learning , Bled, Slovenia , 1999 : 200 ~ 209
0
浏览量
1274
下载量
0
CSCD
关联资源
相关文章
相关作者
相关机构