RT
http://app.xianguo.com/lianbo/android.php
我下载了个,用了一下感觉做得真的不错。
只是有一点不明白。
Rss,标题是有的,内容的,有的网站会有,有没有,多数只是一个内容的简介。但是鲜果,点一篇文章,显示的是文章的内容,他们是怎么取的文章的内容?
用的什么技术?我一直搞不明白,正则表达式?可是每个网站的布局是不同的,而且是可能会改变的,可行吗?
他们是怎么做的?

解决方案 »

  1.   

    没用过,个人感觉和RSS差不多。也是有一个类似协议的东西,可以得到你感兴趣的列表 -> 你可以生成链接,然后还有获取详细内容的(使用和前者关联的Key),这样就可以和链接协同工作了。至于如何组织显示这个列表和详细内容那纯粹就是你网站自己的设计了。服务/发布方提供的是源数据。
      

  2.   

    Rss一般是点击标题,打开那个网页的。
    Rss里标题是肯定有的,但内容不一定有。但鲜果,在查看时,只显示了新闻标题,内容,他是怎么样从网页上抓取这个新闻内容的,这才是我问的。http://www.20ju.com/rss.xml<description><![CDATA[有个职场新人在面试的时候排出一个大名片簿,指着上面的总裁们、CEO们说:虽然我刚出来工作,但我的人脉很广。
    他没拿到这份工作。面试他...<br /><strong>Tags</strong>:<a href='Tags_%E4%BA%BA%E8%84%89%EF%BC%8C%E5%85%B3%E7%B3%BB.htm' target='blank'>人脉,关系</a>&nbsp;&nbsp;]]></description>只是对内容的一个简介,不是完整的内容,鲜是如何获取完整的内容的?
      

  3.   

    根据url访问网站,抓取<title />。猜测。
      

  4.   

    对于一个未知网站结构,能从里面快速得到,这篇文章主要是说什么内容的,想表达什么的。标题是什么,完整内容是什么
    这些有开源的东西在做的,但中文支持不太好。好在国内也有企业网站要提供这样的服务,也有不少基于中文语言分析的开源雏形这里面有人工智能的东西在里面,可以google一下。
      

  5.   

    标题当然可以抓title其实不抓title也可以,因为RSS里标题是有的。
    关键是如何抓取内容。