Administrator 发表于 2011-4-6 22:58:52

Python正文提取算法

太阳 就一个
lol.gif

Administrator 发表于 2011-4-6 23:03:04

niu

Administrator 发表于 2011-4-6 23:03:30

好牛逼

Poison 发表于 2011-4-6 23:18:07

原帖由 xspoco 于 2011-4-6 23:44 发表
back.gif

好牛逼

jacksoking 发表于 2011-4-6 23:24:43

这语言真累,,,,

serverpoint 发表于 2011-4-6 23:36:28

[*]      for div in divs:
[*]                div_html = div.__str__()
[*]                chinese_utf8 = re_chinese.findall(div_html)
[*]                chinese_number = len(chinese_utf8) / 3
[*]                if chinese_number 复制代码这段要改下,迭代里删东西会出问题的
007.gif

007.gif
python 很好...
页: [1]
查看完整版本: Python正文提取算法