HtmlAgility门槛低,正则不好把控;

解决方案 »

  1.   

    这源码难分析啊,相同的标签多了,也没有ID什么的,所以还是根据字符串来分析吧比如:运行模式
    int x=aa.indexof("运行模式");
    string temp=aa.substring(x+16,aa.length-x-16);
    int y=temp.indexof("</");
    string statuStr=temp.substring(0,y-1);
    这里的16就是“运行模式”所在位置到“运行中”之间的字符数量
      

  2.   

    运行模式 是不是可以当做ID呢?
    风量也可以做ID吗
      

  3.   

    需要获取信息:运行模式、加湿功能、温度、湿度 及对应的值。(运行模式、加湿功能、温度、湿度 这几个字是固定的,可以当做ID),求方法。谢谢!
    页面内容如下:
    <table class="matrix">
      <thead>
      <tr>
       <th>运行信息</th>
       <th>状态</th>
      </tr>
      </thead>
      <tbody>
      <tr>
       <td>运行模式</td>
       <td>运行中</td>
      </tr>
      <tr>
       <td>风量</td>
       <td>自动</td>
      </tr>
      <tr>
       <td>加湿功能</td>
       <td>关</td>
      </tr>
      </tbody>
    </table>
    <p>
    <table class="matrix">
      <thead>
      <tr>
       <th>室内温度/湿度</th>
       <th>状态</th>
      </tr>
      </thead>
      <tbody>
      <tr>
       <td>温度</td>
       <td>24℃</td>
      </tr>
      <tr>
       <td>湿度</td>
       <td>63%</td>
      </tr>
      </tbody>
    </table>
    <p>
    <table class="matrix">
      <thead>
      <tr>
       <th>维护状况</th>
       <th>状态</th>
      </tr>
      </thead>
      <tbody>
      <tr>
       <td>保养</td>
       <td>-</td>
      </tr>
      <tr>
       <td>过滤网更换</td>
       <td>-</td>
      </tr>
      <tr>
       <td>净离子发生装置更换</td>
       <td>-</td>
      </tr>
      <tr>
       <td>盛水桶</td>
       <td>-</td>
      </tr>
      </tbody>
    </table>
    <p>
    <table class="layout layoutwidthimage">
     <tr>
      <td class="layoutHead">清洁度监测器状况:</td>
     </tr>
     <tr>
      <td>
       <span class="left1line">污染</span>
       <span class="right1line">干净</span>
      </td>
     </tr>
     <tr>
      <td>
       <img src="kireimonitor_5.png" alt="清洁度监测器状况">
      </td>
     </tr>
    </table>