文章标签 ‘cx-extractor’
2013六月4

网页正文提取技术分析

写作背景 最近做一个项目,其中涉及到网页信息采集,随后对相关的技术进行了学习与研 …

2013六月4

基于行块分布函数的通用网页正文抽取算法cx-extractor

写作背景 由于项目的需求,最近学习网页信息采集,正文抽取这块儿的技术,发现一款不 …