RT
http://app.xianguo.com/lianbo/android.php
我下载了个,用了一下感觉做得真的不错。
只是有一点不明白。
Rss,标题是有的,内容的,有的网站会有,有没有,多数只是一个内容的简介。但是鲜果,点一篇文章,显示的是文章的内容,他们是怎么取的文章的内容?
用的什么技术?我一直搞不明白,正则表达式?可是每个网站的布局是不同的,而且是可能会改变的,可行吗?
他们是怎么做的?
http://app.xianguo.com/lianbo/android.php
我下载了个,用了一下感觉做得真的不错。
只是有一点不明白。
Rss,标题是有的,内容的,有的网站会有,有没有,多数只是一个内容的简介。但是鲜果,点一篇文章,显示的是文章的内容,他们是怎么取的文章的内容?
用的什么技术?我一直搞不明白,正则表达式?可是每个网站的布局是不同的,而且是可能会改变的,可行吗?
他们是怎么做的?
Rss里标题是肯定有的,但内容不一定有。但鲜果,在查看时,只显示了新闻标题,内容,他是怎么样从网页上抓取这个新闻内容的,这才是我问的。http://www.20ju.com/rss.xml<description><![CDATA[有个职场新人在面试的时候排出一个大名片簿,指着上面的总裁们、CEO们说:虽然我刚出来工作,但我的人脉很广。
他没拿到这份工作。面试他...<br /><strong>Tags</strong>:<a href='Tags_%E4%BA%BA%E8%84%89%EF%BC%8C%E5%85%B3%E7%B3%BB.htm' target='blank'>人脉,关系</a> ]]></description>只是对内容的一个简介,不是完整的内容,鲜是如何获取完整的内容的?
这些有开源的东西在做的,但中文支持不太好。好在国内也有企业网站要提供这样的服务,也有不少基于中文语言分析的开源雏形这里面有人工智能的东西在里面,可以google一下。
关键是如何抓取内容。