您现在的位置:首页 >> 基础 >> Java编程 >> 内容

Java去掉字符串中所有的标签,获取纯文本内容--Java学习网

时间:2016-12-7 8:07:39

  核心提示:public class Test {/*** @Title: main* @Description:* @param args* @author* @date 2016年2月17日* 1、去掉字符串...
  1. public class Test {
  2. /**
  3. * @Title: main
  4. * @Description:
  5. * @param args
  6. * @author
  7. * @date 2016年2月17日
  8. * 1、去掉字符串中所有的标签,获取纯文本内容
  9. * 2、获取html节点中img的src路径
  10. */
  11. public static void main(String[] args) {
  12. String html = "<div><p style='color:red;'>12132第一串字符</p></div><br /><div><p>这是第二窜字符</p></div><img width='199' src='_image/12/label'/><img width='199' src='_image/13/label'/><img width='199' src='_image/14/label'/>";
  13. Pattern p = Pattern.compile("<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>");
  14. Matcher m = p.matcher(html);
  15. List<String> srcs = new ArrayList<String>();
  16. while(m.find()){
  17. srcs.add(m.group(1));
  18. }
  19. String regex = "<[^>]*>";
  20. String str = html.replaceAll(regex, "");
  21. System.out.println(str+"\n"+srcs.get(0));
  22. }
  23. }
  24. Java免费学习   Java自学网 http://www.javalearns.com

    关注微信号:javalearns   随时随地学Java

    或扫一扫

    随时随地学Java

作者:不详 来源:网络
    你是从哪里知道本网站的?
  • 网友介绍的
  • 百度搜索的
  • Google搜索的
  • 其它搜索过来的
  • 网址输错了进来的
  • 太忙了不记得了
共有评论 0相关评论
发表我的评论
  • 大名:
  • 内容:
  • java学习网(www.javalearns.com) © 2014 版权所有 All Rights Reserved.
  • Email:javalearns@163.com 站长QQ:1356121699 晋ICP备14003680号-3
  • java学习网部分内容来自网络或网友发布,如侵犯了您利益,请发邮件至:javalearns@126.com,我们尽快处理!
  • Java学习网
  • 网站统计
  • 晋公网安备 14042902000001号