正则表达式分隔半结构化文本 Log4J审计日志 日志样例: 20180111 08:51:06,156 INFO [org.apache.sqoop.audit.FileAuditLogger.logAuditEvent(FileAuditLogger.java:61)] usersqoop.anonymous.user ip189.xxx.xxx.75 opshow objversion objIdx 正则表达式为: ^(d. d)(w ) [(. )] user(w. ) ip(w. )op(w. ) obj(w. )objId(. ). 解析结果如下: 表 Log4J审计日志解析结果 列号 样值 1 20180111 08:51:06,156 2 INFO 3 org.apache.sqoop.audit.FileAuditLogger.logAuditEvent(FileAuditLogger.java:61) 4 sqoop.anonymous.user 5 189.xxx.xxx.75 6 show 7 version 8 x Tomcat日志 日志样例: 11Jan2018 09:00:06.907 INFO [main] org.apache.catalina.startup.VersionLoggerListener.log OS Name: Linux 正则表达式为: ^(d. d)(w ) [(. )] ([w.] ) (w.). 解析结果如下: 表 Tomcat日志解析结果 列号 样值 1 11Jan2018 09:00:06.907 2 INFO 3 main 4 org.apache.catalina.startup.VersionLoggerListener.log 5 OS Name:Linux Django日志 日志样例: [08/Jan/2018 20:59:07 ] settings INFO Welcome to Hue 3.9.0 正则表达式为: ^(. ) (w ) (.). 解析结果如下: 表 Django日志解析结果 列号 样值 1 08/Jan/2018 20:59:07 2 settings 3 INFO 4 Welcome to Hue 3.9.0