皮皮网

皮皮网

【bootloader源码详解】【源码需要翻译吗】【mtm指标 原始 源码】apache commons 源码

时间:2024-11-30 00:20:02 分类:探索

1.程序员的福音 - Apache Commons Lang
2.java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory
3.你知道ApacheCommon包中isNumeric方法是坑吗?
4.StringUtils在commons-lang3和commons-lang中的区别
5.Java必修课判断String是否包含子串的四种方法及性能对比
6.HttpClient4.5使用Commons-logging作为日志记录接口

apache commons 源码

程序员的福音 - Apache Commons Lang

       此文为系列文章的后续篇章,欲了解更多前文内容,请点击链接查阅。

       Apache Commons Lang是对Java标准库java.lang的扩展,在commons工具包中,Lang包是bootloader源码详解最常用的。

       目前Lang包包括commons-lang3和commons-lang两个版本。Lang的最新版本为2.6,适用于Java1.2及以上环境,但官方已不再维护。Lang3的最新版本为3..0,适用于Java8及以上环境,完全支持Java8的特性,并废弃了一些旧的API。由于版本不兼容,源码需要翻译吗Lang3更名为lang3以避免冲突。

       推荐Java8以上的用户使用lang3代替lang。以下内容以lang3 - 3..0版本为例进行说明。

       以下是整体结构:

       以下仅列举其中常用功能进行说明,其余功能可自行查阅源码研究。

       . 日期相关:在Java8之前,日期处理主要依赖于java.util.Date和java.util.Calendar类,但这两个API存在线程安全问题且不够便捷。Java8推出了新的日期API。如果仍在使用旧的日期API,可以使用DateUtils和DateFormatUtils工具类进行转换和计算。

       . 字符串相关:字符串是Java中最常用的类型,相关工具类也最为常用。以下列举了一些常用功能:

       1. 字符串判空

       2. 字符串去空格

       3. 字符串分割

       4. 取子字符串

       5. 其他功能

       6. 随机字符串

       . 反射相关:反射是mtm指标 原始 源码Java的重要特性,Lang包中的反射工具类可以方便地实现反射功能。以下列举了一些常用功能:

       1. 属性操作

       注:方法名含Declared的只会在当前类实例上寻找,不包含Declared的在当前类上找不到则会递归向父类上一直查找。

       2. 获取注解方法

       3. 方法调用

       其他还有ClassUtils,ConstructorUtils,TypeUtils等,不是很常用,有需求的可以现查阅类的源码。

       . 系统相关:主要获取操作系统和JVM的一些信息。

       . 总结:除了以上介绍的工具类外,还有其他不常用的工具类。感兴趣的用户可以自行查阅源码研究。

java.lang.NoClassDefFoundError: org/apache/commons/logging/LogFactory

       åŽ»ä¸‹è½½ä¸€ä¸ªapache commons

       mons.apache.org/

       log4j.jar

       Logging.jar

       OK

       Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式;通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过程。最令人感兴趣的就是,这些可以通过一个配置文件来灵活地进行配置,而不需要修改应用的代码。

       static Logger logger = Logger.getLogger(MyApp.class.getName());

       logger.info("exception");

你知道ApacheCommon包中isNumeric方法是坑吗?

       使用的Apache-Common包的版本是commons-lang-2.6.jar

       本文就来分享一个这个坑的情况,以免其它tx也掉坑中

       费话不多说,一跳源码来看代码: package chapter4; import org.apache.commons.lang.StringUtils; /** * Created by MyWorld on /3/. */ public class StringUtilsIsNumericChecker { public static void main(String[] args) { System.out.println(StringUtils.isNumeric("1")); System.out.println(StringUtils.isNumeric("-1")); } }

       围观的tx,认为上面api的输出结果会是什么呢?两个true? 好吧,执行一行看看结果: true false

       什么情况,-1不是数字吗? 为什么是false呢 来分析下源码: public static boolean isNumeric(String str) { if (str == null) { return false; } int sz = str.length(); for (int i = 0; i sz; i++) { if (Character.isDigit(str.charAt(i)) == false) { return false; } } return true; }

       源码中判断是否数字的依据是JDK的API: java.lang.Character.isDigit(str.charAt(i)) 看看个API的源码: public static boolean isDigit(char ch) { return isDigit((int)ch); }

       看看isDigit(int codePoint)的源码: public static boolean isDigit(int codePoint) { boolean bDigit = false; if (codePoint = MIN_CODE_POINT codePoint = FAST_PATH_MAX) { bDigit = CharacterDataLatin1.isDigit(codePoint); } else { int plane = getPlane(codePoint); switch(plane) { case(0): bDigit = CharacterData.isDigit(codePoint); break; case(1): bDigit = CharacterData.isDigit(codePoint); break; case(2): bDigit = CharacterData.isDigit(codePoint); break; case(3): // Undefined case(4): // Undefined case(5): // Undefined case(6): // Undefined case(7): // Undefined case(8): // Undefined case(9): // Undefined case(): // Undefined case(): // Undefined case(): // Undefined case(): // Undefined bDigit = CharacterDataUndefined.isDigit(codePoint); break; case(): bDigit = CharacterData0E.isDigit(codePoint); break; case(): // Private Use case(): // Private Use bDigit = CharacterDataPrivateUse.isDigit(codePoint); break; default: // the argument's plane is invalid, and thus is an invalid codepoint // bDigit remains false; break; } } return bDigit; }

       下面还有更深的调用,貌似还涉及到ASCII码了。 水太深,就不继续看了。 有一点是肯定的,这个API不是通过类似Regex expression的方式来判断是数字,而通过每个字符的ASCII的值类确定的 回到API的isNumeric(String str), 看看Doc是怎么说的: /** * pChecks if the String contains only unicode digits. * A decimal point is not a unicode digit and returns false./p * * pcodenull/code will return codefalse/code. * An empty String (length()=0) will return codetrue/code./p * * pre * StringUtils.isNumeric(null)  = false * StringUtils.isNumeric("")   = true * StringUtils.isNumeric(" ")  = false * StringUtils.isNumeric("") = true * StringUtils.isNumeric(" 3") = false * StringUtils.isNumeric("ab2c") = false * StringUtils.isNumeric("-3") = false * StringUtils.isNumeric(".3") = false * /pre * * @param str the String to check, may be null * @return codetrue/code if only contains digits, and is non-null */

       看完上面的Doc,感觉水好深。 这个API的方法名直接命名为isInt不就完了。方法名很容易误导人 这也是跌幅变色指标源码给开发的tx敲了一个警钟, api使用之前一定要确认清楚,至少看看Doc文档吧

StringUtils在commons-lang3和commons-lang中的区别

        (1)入参类型不同

        commons.lang中入参为 Sring str

        commons.lang3中入参为 CharSequence cs(适用范围更广)

        (2)入参数量不同

        commons.lang3中支持多入参

        最近经常需要对String做一些判断和处理,于是就用到了Apache提供的StringUtils这个工具类,用的时候发现有两个不同的版本,一个版本位于org.apache.commons.lang下面,另一个则位于org.apache.commons.lang3下面。

        查了一下资料,lang3是Apache Commons 团队发布的工具包,要求jdk版本在1.5以上,相对于lang来说完全支持java5的特性,废除了一些旧的API。该版本无法兼容旧有版本,于是为了避免冲突改名为lang3。这些东西就不再细说了,我们来看看StringUtils中常用的一些方法有什么改变吧。

        可以看到这几个方法逻辑毫无变化,只是参数类型变了,由String变为CharSequence。那么这个CharSequence是什么呢?我们看看它的源码:

        CharSequence是一个字符序列的接口,其中定义了一些常用的如length()、subSequence()等方法,String也实现了这个接口。当然大家可能在String里用到的都是subString(),实际上String也实现了subSequence()这个方法,只是直接指向了subString()。

        lang3中使用CharSequence最大的好处就是令这些方法用处更加广泛,不止局限于String,其他一些实现了该接口的类也可以使用StringUtils中的这些方法去进行一些操作。另外我发现很多nio中的类都实现了这个接口,个人猜测可能也有为nio服务的目的。

        在lang中,第一步是先判断str1是否为空,而在lang3中,第一步则是先判断两个对象是否相同。这个不难理解,如果两个对象的地址相同,那么它们指向的就是同一个对象,内容肯定相同。

        在lang3中,还加入了一些同时判断多个参数的方法,可以看到实际上是将参数列表放入一个CharSequence数组中,然后遍历调用之前的isEmpty等方法。判断blank也有类似的方法。

        可能有人会觉得,很多方法String本身就有啊,为什么还要用StringUtils提供的呢?抛开参数类型不谈,我们可以看到,StringUtils中的方法大多都做了空校验,如果为空时会返回Null或者空串,而String本身的方法在很多传入参数或对象本身为空的时候都会报空指针错误。

        参考地址: StringUtils在commons-lang3和commons-lang中的区别

Java必修课判断String是否包含子串的四种方法及性能对比

       判断一个字符串是否包含某个特定子串是常见的场景,比如判断一篇文章是否包含敏感词汇、判断日志是否有ERROR信息等。本文将介绍四种方法并进行性能测试。

       在String的函数中,提供了indexOf(subStr)方法,返回子串subStr第一次出现的位置,如果不存在则返回-1。例子如下:

       最直观判断的方法是contains(subStr),返回类型为boolean,如果包含返回true,不包含则返回false。例子如下:

       实际上,String的contains方法是通过调用indexOf方法来判断的,源码如下:

       通过强大的正则匹配来判断,虽然有点杀鸡用牛刀的感觉,但也不是不能用,例子如下:

       Apache的commons-lang3提供许多开箱即用的功能,StringUtils就提供了许多与字符串相关的功能,例子如下:

       我们使用JMH工具来对四种方法进行性能测试,Maven引入代码如下:

       测试代码如下:

       测试结果如下:

       最快的就是indexOf方法,其次是contains方法,二者应该没有实际区别,contains是调用indexOf来实现的。Apache的StringUtils为第三方库,相对慢一些。最慢的是使用了正则的Pattern的方法,这不难理解,正则引擎的匹配是比较耗性能的。

       本文介绍了判断一个字符串是否包含某个特定子串的四种方法,并通过性能测试进行了对比。其中性能最好的是String的indexOf方法和contains方法,建议使用contains方法,性能好,跟indexOf相比,更直观,更不容易犯错。毕竟让每个人时刻记住返回-1代表不存在也不是一件容易的事。

       但是,使用indexOf和contains方法都需要注意做判空处理,这时StringUtils的优势就体现出来了。

       总结,四种方法如下:

       indexOf(subStr):返回子串第一次出现的位置,不存在返回-1。

       contains(subStr):返回true或false,是否包含。

       Pattern匹配:使用正则匹配,相对耗性能。

       StringUtils.contains:Apache库提供,相对慢。

       性能测试结果显示,indexOf和contains方法最佳,建议使用contains方法。Apache库的StringUtils方法相对慢,正则匹配方法最慢。在使用方法时,注意处理空值问题。希望本文能帮助你更好地理解和使用这些方法。

HttpClient4.5使用Commons-logging作为日志记录接口

       Apache HttpClient 4.5采用Commons-logging作为日志记录接口,此接口被广泛应用于日志实现与解耦设计。在org.apache.mons-logging.jar被加入到CLASSPATH后,系统自动猜测并设置所需日志工具,无需额外配置。默认LogFactory按照以下步骤自动发现并决定使用日志实现类:

       首先在classpath下查找commons-logging.properties文件,使用其定义的Log实现类。若未找到,则查找是否已定义系统环境变量org.apache.commons.logging.Log,使用其指定的Log实现类。

       查看classpath中是否存在Log4j的包,若有,则自动选用Log4j作为日志实现。

       若未发现Log4j包,则使用JDK自身的日志实现类(适用于JDK1.4及以上版本)。

       若前三种情况均未满足,则使用commons-logging提供的简单日志实现类SimpleLog。

       综上,Apache HttpClient 4.5通过Commons-logging接口实现高效灵活的日志管理,简化日志工具的选择与集成过程。