- 浏览: 741106 次
- 性别:
- 来自: 郑州
文章分类
- 全部博客 (396)
- JAVA (50)
- ORACLE (22)
- HIBERNATE (1)
- SPRING (26)
- STRUTS (4)
- OTHERS (0)
- MYSQL (11)
- Struts2 (16)
- JS (33)
- Tomcat (6)
- DWR (1)
- JQuery (26)
- JBoss (0)
- SQL SERVER (0)
- XML (10)
- 生活 (3)
- JSP (11)
- CSS (5)
- word (1)
- MyEclipse (7)
- JSTL (1)
- JEECMS (2)
- Freemarker (8)
- 页面特效 (1)
- EXT (2)
- Web前端 js库 (2)
- JSON http://www.json.org (3)
- 代码收集 (1)
- 电脑常识 (6)
- MD5加密 (0)
- Axis (0)
- Grails (1)
- 浏览器 (1)
- js调试工具 (1)
- WEB前端 (5)
- JDBC (2)
- PowerDesigner (1)
- OperaMasks (1)
- CMS (1)
- Java开源大全 (2)
- 分页 (28)
- Eclipse插件 (1)
- Proxool (1)
- Jad (1)
- Java反编译 (2)
- 报表 (6)
- JSON (14)
- FCKeditor (9)
- SVN (1)
- ACCESS (1)
- 正则表达式 (3)
- 数据库 (1)
- Flex (3)
- pinyin4j (2)
- IBATIS (3)
- probe (1)
- JSP & Servlet (1)
- 飞信 (0)
- AjaxSwing (0)
- AjaxSwing (0)
- Grid相关 (1)
- HTML (5)
- Guice (4)
- Warp framework (1)
- warp-persist (1)
- 服务器推送 (3)
- eclipse (1)
- JForum (5)
- 工具 (1)
- Python (1)
- Ruby (1)
- SVG (3)
- Joda-Time日期时间工具 (1)
- JDK (3)
- Pushlet (2)
- JSP & Servlet & FTP (1)
- FTP (6)
- 时间与效率 (4)
- 二维码 (1)
- 条码/二维码 (1)
最新评论
-
ctrlc:
你这是从web服务器上传到FTP服务器上的吧,能从用户电脑上上 ...
jsp 往 FTP 上传文件问题 -
annybz:
说的好抽象 为什么代码都有两遍。这个感觉没有第一篇 和第二篇 ...
Spring源代码解析(三):Spring JDBC -
annybz:
...
Spring源代码解析(一):IOC容器 -
jie_20:
你确定你有这样配置做过测试? 请不要转载一些自己没有测试的文档 ...
Spring2.0集成iReport报表技术概述 -
asd51731:
大哥,limit传-1时出错啊,怎么修改啊?
mysql limit 使用方法
package com.xcy.babyonline.common.utils; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * <p> * * <p> * Copyright the original author or authors. * * @author Tiger1102 * @date 2011-4-27 * @dateLastModified 2011-4-27 */ public class HtmlRegexpUtil { private final static String regxpForHtml = "<([^>]*)>"; // 过滤所有以<开头以>结尾的标签 private final static String regxpForImgTag = "<\\s*img\\s+([^>]*)\\s*>"; // 找出IMG标签 private final static String regxpForImaTagSrcAttrib = "src=\"([^\"]+)\""; // 找出IMG标签的SRC属性 /** * */ public HtmlRegexpUtil() { // TODO Auto-generated constructor stub } /** * * 基本功能:替换标记以正常显示 * <p> * * @param input * @return String */ public String replaceTag(String input) { if (!hasSpecialChars(input)) { return input; } StringBuffer filtered = new StringBuffer(input.length()); char c; for (int i = 0; i <= input.length() - 1; i++) { c = input.charAt(i); switch (c) { case '<': filtered.append("<"); break; case '>': filtered.append(">"); break; case '"': filtered.append("""); break; case '&': filtered.append("&"); break; default: filtered.append(c); } } return (filtered.toString()); } /** * * 基本功能:判断标记是否存在 * <p> * * @param input * @return boolean */ public boolean hasSpecialChars(String input) { boolean flag = false; if ((input != null) && (input.length() > 0)) { char c; for (int i = 0; i <= input.length() - 1; i++) { c = input.charAt(i); switch (c) { case '>': flag = true; break; case '<': flag = true; break; case '"': flag = true; break; case '&': flag = true; break; } } } return flag; } /** * * 基本功能:过滤所有以"<"开头以">"结尾的标签 * <p> * * @param str * @return String */ public static String filterHtml(String str) { Pattern pattern = Pattern.compile(regxpForHtml); Matcher matcher = pattern.matcher(str); StringBuffer sb = new StringBuffer(); boolean result1 = matcher.find(); while (result1) { matcher.appendReplacement(sb, ""); result1 = matcher.find(); } matcher.appendTail(sb); return sb.toString(); } /** * * 基本功能:过滤指定标签 * <p> * * @param str * @param tag * 指定标签 * @return String */ public static String fiterHtmlTag(String str, String tag) { String regxp = "<\\s*" + tag + "\\s+([^>]*)\\s*>"; Pattern pattern = Pattern.compile(regxp); Matcher matcher = pattern.matcher(str); StringBuffer sb = new StringBuffer(); boolean result1 = matcher.find(); while (result1) { matcher.appendReplacement(sb, ""); result1 = matcher.find(); } matcher.appendTail(sb); return sb.toString(); } /** * * 基本功能:替换指定的标签 * <p> * * @param str * @param beforeTag * 要替换的标签 * @param tagAttrib * 要替换的标签属性值 * @param startTag * 新标签开始标记 * @param endTag * 新标签结束标记 * @return String * @如:替换img标签的src属性值为[img]属性值[/img] */ public static String replaceHtmlTag(String str, String beforeTag, String tagAttrib, String startTag, String endTag) { String regxpForTag = "<\\s*" + beforeTag + "\\s+([^>]*)\\s*>"; String regxpForTagAttrib = tagAttrib + "=\"([^\"]+)\""; Pattern patternForTag = Pattern.compile(regxpForTag); Pattern patternForAttrib = Pattern.compile(regxpForTagAttrib); Matcher matcherForTag = patternForTag.matcher(str); StringBuffer sb = new StringBuffer(); boolean result = matcherForTag.find(); while (result) { StringBuffer sbreplace = new StringBuffer(); Matcher matcherForAttrib = patternForAttrib.matcher(matcherForTag .group(1)); if (matcherForAttrib.find()) { matcherForAttrib.appendReplacement(sbreplace, startTag + matcherForAttrib.group(1) + endTag); } matcherForTag.appendReplacement(sb, sbreplace.toString()); result = matcherForTag.find(); } matcherForTag.appendTail(sb); return sb.toString(); } }
发表评论
-
图片压缩
2012-05-14 15:48 1636/** * WriteImage.java Crea ... -
BeanUtils.copyProperties与PropertyUtils.copyProperties用法及区别
2012-02-24 17:11 982一、简介: BeanUtils提供 ... -
[转]给网站上传的图片盖章
2011-12-30 16:13 902/****************************** ... -
[转] 给网站上传的图片盖章
2011-12-30 16:12 969/****************************** ... -
java 给图片加文字水印
2011-12-30 16:10 2122java给图片加水印,在网上有很多资料,但我想要一个能自适 ... -
joda time 方便快捷 .
2011-12-01 11:08 855操作日期不再那么麻烦 DateTime dt ... -
异常:getOutputStream() has already been called for this response 的解决方法
2011-11-25 17:58 1156今天在第一次接触使用“验证码”功能时,在执行时出现了异常信息: ... -
jsp中文件下载的实现
2011-11-21 18:21 1119jsp中实现文件下载的最简单的方式是在网页上做超级链接,如 ... -
jsp 往 FTP 上传文件问题
2011-11-21 18:17 2466FtpUtil: import java.io.DataI ... -
Java中读取字节流并按指定编码转换成字符串的方法
2011-11-21 18:13 1163该方法中使用一个无限循环,从字节流中读取字节,存放到byte数 ... -
InputStream转String
2011-11-21 18:09 1172org.apache.commons.io.output.B ... -
关于response.sendRedirect使用的注意事项
2011-10-12 19:40 912使用response.sendRedirect时就需要注意以下 ... -
在EditPlus中配置JDK编译JAVA的详细方法
2011-08-09 18:17 727在EditPlus中配置JDK编译JAVA的详细方法 -
Linux下Jsp环境搭建 Java平台 Tomcat安装 MySQL安装配置
2011-05-11 14:08 1501安装软件 1、安装JDK(因JDK包含JRE,若原来装 ... -
Java中怎么遍历map中value值
2011-04-22 15:21 1280//两种方法,有问题,给我发百度消息 public sta ... -
Java 获取指定日期的方法总结
2011-04-13 19:14 1534格式化日期 String-->Date 或者 Data ... -
java位与运算
2011-02-11 17:20 2138位与运算的实质是将参与运算的两个数据,按对应的二进制数逐位进行 ... -
技术网站
2011-02-11 11:03 844OpenSource: http://www.open-ope ... -
Java或Web中解决所有路径问题
2011-01-27 09:58 862Java中使用的路径,分为两种:绝对路径和相对路径。归根结底, ... -
给出一个字符串或其他,返回一个指定长度的字符串,长度小于指定长度,用指定字符填充
2011-01-19 17:25 1319实现代码如下: publ ...
相关推荐
VB 网页标签提取与过滤 过滤掉网页图片、脚本、多媒体对象等 提取图片、链接、mp3等
java过滤html,css,js标签工具类(UnHtmlScript),抓取页面内容去除标签样式信息
vb编写的通过正则过滤所有网页标签提取字符串,希望你喜欢。
通过正则表达式过滤到html中的标签,将内容保存下来
本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下: 如果你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包含进去了...
网页标签过滤,没有 多线程,也没有 文本处理,只有涉及到字符串截取 本地文本写入,有 这么低级的代码是因为这个路由器页面非常垃圾,用不到~~~,不过这样也适合初学者观看,当然了,后续会尝试添加更多功能 ...
jQuery实现网页关键字过滤效果,将需要过滤的文字定义在JavaScript中,可定义多个,不过要修改JS代码为数组,这样可过滤出多个不同的关键字,本例只是为你演示一个基本的功能,更多过滤功能请自己挖掘吧。...
“筛选同类标签”作用是用来过滤页面上同类定位标签,然后点击“测试列表定位” 三、“抓取信息标签”是指列表后页面中要制定抓取的信息容器型标签。(如果抓取整页信息请为空),然后点 击“开始抓取列表内容”。 ...
6)4.0版本支持IE 7.0,要摘录多个网页标签中的某一个网页的图片,只需将网页标签切换到该网页再摘录即可。 7)4.6修改了在IE工具栏不显示图标的问题 8)4.7增加了按序号保存图片功能。可以指定图片文件的前缀。 9)4.8...
移除HTML标签的正则表达式,这里是asp版本,注意是看正则的写法,脚本之家以前也发布过类似的代码。
“筛选同类标签”作用是用来过滤页面上同类定位标签,然后点击“测试列表定位” 三、“抓取信息标签”是指列表后页面中要制定抓取的信息容器型标签。(如果抓取整页信息请为空),然后点 击“开始抓取列表内容”。 ...
基于行分块函数的方法解决网页正文的提取,先爬取网页在经过正则的过滤标签,之后就是用的行分块函数。
主要语言:JavaScript 项目分类:[工具] 项目标签:[广告拦截] 推荐理由:一个广告过滤工具,它是一个具有一般性用途的过滤工具,屏蔽广告的...它是一个功能强大的浏览器扩展,可以帮助用户过滤网页上的不必要内容。
超级超级真棒护理标签过滤器 这种craaaaaazy过滤器会将各种单词和短语更改为care-tags:trade_mark:批准的版本。 打包为Chrome扩展程序。 前: 嘿,fam,有人走了,会和我一起吃早午餐吗? 大声笑! 还有对Fetty ...
代码如下:function setContent(str) {str = str.replace(/<...测试的时候发现这段代码不能过滤掉网页中空格字符(即: )。于是自己又改造了一下: 代码如下:function removeHTMLTag(str) { str = str.replace
提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV 标签把HTML文档解析成DIV森林,然后过滤掉DW标签树中的噪声结点并且建立STU-DIV模型 树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树...
采用正则过滤掉ul、script、style、注释等内容,标记该内容为A,然后过滤所有标签,再标记该内容为B。然后定义k行为一个行块,去掉空格的长度为行块长度。将过滤掉标签的内容B进行行块长度统计,根据行块分布找出最...