Skip to content

2020 04 05 [ASM字节码编程]JavaAgent+ASM字节码插桩采集方法名称以及入参和出参结果并记录方法耗时

fuzhengwei edited this page May 16, 2020 · 1 revision

作者:小傅哥
博客:https://bugstack.cn - 原创系列专题

沉淀、分享、成长,让自己和他人都能有所收获!

一、前言

在我们实际的业务开发到上线的过程中,中间都会经过测试。那么怎么来保证测试质量呢?比如;提交了多少代码、提交了多少方法、有单元测试吗、影响了那些流程链路、有没有夹带上线。

大部分时候这些问题的汇总都是人为的方式进行提供,以依赖相信研发为主。剩下的就需要依赖有经验的测试进行白盒验证。所以即使是这样测试也会在上线后发生很多未知的问题,毕竟流程太长,影响面太广。很难用一个人去照顾到所有流程。

所以,我很希望使用技术手段来解决这一问题,通过服务质量监控来在研发提测后,自动报告相关数据,例如;研发代码涉及流程链路展示、每个链路测试次数、通过次数、失败次数、当时的出入参信息以及对应的代码块在当前提测分支修改记录等各项信息。最终测试在执行验证时候,分配验证渠道扫描到所有分支节点,可以清晰的看到全链路的影响。那么,这样的测试才是可以保证系统的整体质量的。

好!接下来到后续一段时间,我会不断的去完善和开发这些功能。也欢迎你的加入!

二、技术目标

技术行为都是为目标服务的,也就是实现务产品功能

而我们这个文章的目标是需要使用固定的技术栈 JavaAgent + ASM,来抓取方法执行时候的信息,包括:类名称、方法名称、入参信息和入参值、出参信息和出参值以及当前方法的耗时。

JavaAgent,是一种探针技术可以通过 premain 方法,在类加载的过程中给指定的方法进行字节码增强。其实你的每一个类最终都是字节码指令的执行,而这种增强后的方法就可以输出我们想要的信息。这就相当于你硬编码时候输出了一些方法的耗时,日志等信息。

ASM,是一个 Java 字节码操控框架。它能被用来动态生成类或者增强既有类的功能。ASM 可以直接产生二进制 class 文件,也可以在类被加载入 Java 虚拟机之前动态改变类行为。Java class 被存储在严格格式定义的 .class 文件里,这些类文件拥有足够的元数据来解析类中的所有元素:类名称、方法、属性以及 Java 字节码(指令)。ASM 从类文件中读入信息后,能够改变类行为,分析类信息,甚至能够根据用户要求生成新类。说白了asm是直接通过字节码来修改class文件。另外除了 asm 可以操作字节码,还有javassist和Byte-code等,他们比 asm 要简单,但是执行效率还是 asm 高。因为 asm 是直接使用指令来控制字节码。

三、实现方案

字节码增强实现方案

按照图中我们使用 javaAgentprimain 方法,使用 asm 进行字节码增强,以便于输出我们的监控信息。最终在我们把字节码增强后,程序所执行的就是我们的新的方法字节码,从而也就可以获取到我们需要的信息。那么,接下来我们开始一步步上线这些功能。

关于实现方案中的所有源码,可以通过关注公众号:bugstack虫洞栈,回复源码下载进行获取

1. 定义测试方法

public class ApiTest {

    public static void main(String[] args) throws InterruptedException {
        ApiTest apiTest = new ApiTest();
        String res01 = apiTest.queryUserInfo(111, 17);
        System.out.println("测试结果:" + res01 + "\r\n");;
    }

    public String queryUserInfo(int uId, int age) throws InterruptedException {
        return "你好,bugstack虫洞栈 | 精神小伙!";
    }

}
  • 这里我们定义了一个查询用户信息的测试方法,后续不断将这个方法进行字节码增强。

2. 监控类入口

PreMain.java & 入口方法

public class PreMain {

    //JVM 首先尝试在代理类上调用以下方法
    public static void premain(String agentArgs, Instrumentation inst) {
        inst.addTransformer(new ProfilingTransformer());
    }

    //如果代理类没有实现上面的方法,那么 JVM 将尝试调用该方法
    public static void premain(String agentArgs) {
    }

}

MANIFEST.MF & 配置

Manifest-Version: 1.0
Premain-Class: org.itstack.sqm.asm.PreMain
Can-Redefine-Classes: true
  • 以上是固定的基础模板代码,所有的 JavaAgent 程序都需要从这里开始。

3. 字节码方法处理

public class ProfilingTransformer implements ClassFileTransformer {

    @Override
    public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, ProtectionDomain protectionDomain, byte[] classfileBuffer) throws IllegalClassFormatException {
        try {

        	// 排除一些不需要处理的方法
            if (ProfilingFilter.isNotNeedInject(className)) {
                return classfileBuffer;
            }

            return getBytes(loader, className, classfileBuffer);;
        } catch (Throwable e) {
            System.out.println(e.getMessage());
        }
        return classfileBuffer;
    }

    ...

}
  • 这里主要通过传入进行的类加载器、类名、字节码等,负责字节码的增强操作。而这里会使用 ASM 方式进行处理,如下;

     private byte[] getBytes(ClassLoader loader, String className, byte[] classfileBuffer) {
         ClassReader cr = new ClassReader(classfileBuffer);
         ClassWriter cw = new ClassWriter(cr, ClassWriter.COMPUTE_MAXS);
         ClassVisitor cv = new ProfilingClassAdapter(cw, className);
         cr.accept(cv, ClassReader.EXPAND_FRAMES);
         return cw.toByteArray();
     }

4. 字节码方法解析

字节码方法解析

  • 当程序启动加载的时候,每个类的每一个方法都会被监控到。类的名称、方法的名称、方法入参出参的描述等,都可以在这里获取。
  • 为了可以在后续监控处理不至于每一次都去传参(方法信息)浪费消耗性能,一般这里都会给每个方法生产一个全局防重的 id ,通过这个 id 就可以查询到对应的方法。
  • 另外从这里可以看到的方法的入参和出参被描述成一段指定的码,(II)Ljava/lang/String; ,为了我们后续对参数进行解析,那么需要将这段字符串进行拆解。

4.1 解析方法入参和出参

asm 文档中说明过关于字节码结构和方法的信息,I;int、Ljava/lang/String;String,所以我们可以分析出这个方法的是两个 int 类型的入参和一个 String 类型的出参。也就是;String queryUserInfo(int uId, int age)

那么这个方法的入参除了这么简单的,还会很复杂的,比如:(Ljava/lang/String;Ljava/lang/Object;Ljava/lang/String;IJ[I[[Ljava/lang/Object;Lorg/itstack/test/Req;)Ljava/lang/String; 对于这样的字符串内容需要使用到正则表达式进行解析。

正则解析方法描述

@Test
public void test_desc() {
    String desc = "(Ljava/lang/String;Ljava/lang/Object;Ljava/lang/String;IJ[I[[Ljava/lang/Object;Lorg/itstack/test/Req;)Ljava/lang/String;";

    Matcher m = Pattern.compile("(L.*?;|\\[{0,2}L.*?;|[ZCBSIFJD]|\\[{0,2}[ZCBSIFJD]{1})").matcher(desc.substring(0, desc.lastIndexOf(')') + 1));

    while (m.find()) {
        String block = m.group(1);
        System.out.println(block);
    }

}

测试结果

Ljava/lang/String;
Ljava/lang/Object;
Ljava/lang/String;
I
J
[I
[[Ljava/lang/Object;
Lorg/itstack/test/Req;

Process finished with exit code 0
  • 可以看到我们将所有的参数类型已经解析出来,因为只有通过这样的解析我们才能去处理方法中入参。这主要是8个基本类型需要进行类型转换为对象,填充到数组中,方便我们输出结果。

4.2 提取类和方法生产标识ID

接下来我们将解析的方法信息包括入参、出参结果生产方法的标识ID,这个ID是一个全局唯一的,每一个方法都有一个固定的标识。如下;

methodId = ProfilingAspect.generateMethodId(new MethodTag(fullClassName, simpleClassName, methodName, desc, parameterTypeList, desc.substring(desc.lastIndexOf(')') + 1)));

public static int generateMethodId(MethodTag tag) {
    int methodId = index.getAndIncrement();
    if (methodId > MAX_NUM) return -1;
    methodTagArr.set(methodId, tag);
    return methodId;
}
  • 这是一个原子性用户自增的ID,AtomicInteger,同时也提供了一个对应的集合;AtomicReferenceArray<MethodTag>
  • 当我们每添加一个方法就会使用这个工具生产一个对应的ID,同时存放到集合中,并返回。这个生成的过程是一次性的,所以也不会影响执行时候的耗时。

5. 字节码增强「方法进入」

ProfilingMethodVisitor extends AdviceAdapter 中,可以重写方法 onMethodEnter 。也就是当方法进入时候设置开始时间和收集入参到数组中。而收集入参的过程相对会复杂一些,需要使用字节码指令创建数据,之后把每一个入参在使用字节码加载到数组中。这个过程有点像我们写代码,定义数组设置参数。

5.1 在方法里设置开始时间

这段代码我们需要使用字节码指令插桩到方法的开始处

long var3 = System.nanoTime();

字节码插桩处理

mv.visitMethodInsn(INVOKESTATIC, "java/lang/System", "nanoTime", "()J", false);
startTimeIdentifier = newLocal(Type.LONG_TYPE);
mv.visitVarInsn(LSTORE, startTimeIdentifier);	
字节码 描述
INVOKESTATIC 调用静态方法
LSTORE 将栈顶long类型值保存到局部变量indexbyte中

5.2 初始化入参装填数组

使用字节码的方式去初始化一个参数数量的数组

Object[] var6 = new Object[](x);

通过字节码的方式进行创建数组

if (parameterCount >= 4) {
    mv.visitVarInsn(BIPUSH, parameterCount);//初始化数组长度
} else {
    switch (parameterCount) {
        case 1:
            mv.visitInsn(ICONST_1);
            break;
        case 2:
            mv.visitInsn(ICONST_2);
            break;
        case 3:
            mv.visitInsn(ICONST_3);
            break;
        default:
            mv.visitInsn(ICONST_0);
    }
}
mv.visitTypeInsn(ANEWARRAY, Type.getDescriptor(Object.class));
字节码 描述
BIPUSH valuebyte值带符号扩展成int值入栈
ANEWARRAY 创建引用类型的数组

这里有一个数组大小的判断,如果小于4会使用 ICONST 初始化长度。

5.3 给数组赋值

给数组赋值相当于如下效果,只不过需要经过一些字节码的方式进行处理

Object[] var6 = new Object[]{var1, var2};

通过字节码的方式进行初始化

 // 给数组赋参数值
for (int i = 0; i < parameterCount; i++) {
    mv.visitInsn(DUP);
    mv.visitVarInsn(BIPUSH, i);
    String type = parameterTypeList.get(i);
	if ("Z".equals(type)) {
	    mv.visitVarInsn(ILOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Boolean", "valueOf", "(Z)Ljava/lang/Boolean;", false);
	} else if ("C".equals(type)) {
	    mv.visitVarInsn(ILOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Character", "valueOf", "(C)Ljava/lang/Character;", false);
	} else if ("B".equals(type)) {
	    mv.visitVarInsn(ILOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Byte", "valueOf", "(B)Ljava/lang/Byte;", false);
	} else if ("S".equals(type)) {
	    mv.visitVarInsn(ILOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Short", "valueOf", "(S)Ljava/lang/Short;", false);
	} else if ("I".equals(type)) {
	    mv.visitVarInsn(ILOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Integer", "valueOf", "(I)Ljava/lang/Integer;", false);
	} else if ("F".equals(type)) {
	    mv.visitVarInsn(FLOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Float", "valueOf", "(F)Ljava/lang/Float;", false);
	} else if ("J".equals(type)) {
	    mv.visitVarInsn(LLOAD, ++cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Long", "valueOf", "(J)Ljava/lang/Long;", false);
	} else if ("D".equals(type)) {
	    cursor += 2;
	    mv.visitVarInsn(DLOAD, cursor);  //获取对应的参数
	    mv.visitMethodInsn(INVOKESTATIC, "java/lang/Double", "valueOf", "(D)Ljava/lang/Double;", false);
	} else {
	    ++cursor;
	    mv.visitVarInsn(ALOAD, cursor);  //获取对应的参数
	}
	mv.visitInsn(AASTORE);

	mv.visitVarInsn(ASTORE, parameterIdentifier);
}

这里在赋值的过程中,包括了对基本类型的转换,否则是不能放入到的 Object 数组中的。因为它们 int long ... 都不是对象类型

字节码 描述
ILOAD 从局部变量indexbyte中装载int类型值入栈
INVOKESTATIC 调用静态方法
AASTORE 将栈顶引用类型值保存到指定引用类型数组的指定项

到这为止,我们就已经将参数初始化到数组中了,后面就可以将参数通过方法传递出去。

6. 字节码增强「方法退出」

在方法结束后这里还提供给我们一个退出的方法 onMethodExit ,我们可以通过这个方法的重写,使用字节码获取出参并一起输出到外部。

6.1 获取 return 出参值

通过字节码的方式,实现下面出参赋值给一个属性,并最终把值给 return

Object var7 = "你好,bugstack虫洞栈 | 精神小伙!";
ProfilingAspect.point(var3, 0, var6, var7);
return uId;

通过字节码方式进行处理

switch (opcode) {
    case RETURN:
        break;
    case ARETURN:
        mv.visitVarInsn(ASTORE, ++localCount); // 6
        mv.visitVarInsn(ALOAD, localCount);    // 6
        break;
}

6.2 最终将方法信息输出给外部

mv.visitVarInsn(LLOAD, startTimeIdentifier);
mv.visitLdcInsn(methodId);
if (parameterTypeList.isEmpty()) {
    mv.visitMethodInsn(INVOKESTATIC, Type.getInternalName(ProfilingAspect.class), "point", "(JI)V", false);
} else {
    mv.visitVarInsn(ALOAD, parameterIdentifier);  // 5
    mv.visitVarInsn(ALOAD, localCount);           // 6
    mv.visitMethodInsn(INVOKESTATIC, Type.getInternalName(ProfilingAspect.class), "point", "(JI[Ljava/lang/Object;Ljava/lang/Object;)V", false);
}
  • LLOAD ,从局部变量indexbyte中装载long类型值入栈。这里加载的就是方法的启动时间。

  • LDC , 常量池中的常量值(int, float, string reference, object reference)入栈。这里是加载方法ID;methodId

  • ALOAD ,parameterIdentifier ,从局部变量indexbyte中装载引用类型值入栈。此时加载参数数组信息。

  • ALOAD ,localCount ,加载的是返回值信息,也就是 return 的结果。

  • INVOKESTATIC ,最后就是调用静态方法输出结果信息,这个静态方法是我们已经预设好的,如下;

     public static void point(final long startNanos, final int methodId, Object[] requests, Object response) {
         MethodTag method = methodTagArr.get(methodId);
         System.out.println("监控 - Begin");
         System.out.println("类名:" + method.getFullClassName());
         System.out.println("方法:" + method.getMethodName());
         System.out.println("入参类型:" + JSON.toJSONString(method.getParameterTypeList()));
         System.out.println("入数[值]:" + JSON.toJSONString(requests));
         System.out.println("出参类型:" + method.getReturnParameterType());
         System.out.println("出参[值]:" + JSON.toJSONString(response));
         System.out.println("耗时:" + (System.nanoTime() - startNanos) / 1000000 + "(s)");
         System.out.println("监控 - End\r\n");
     }

四、测试验证

1. 需要测试的方法

public class ApiTest {

    public static void main(String[] args) throws InterruptedException {
        ApiTest apiTest = new ApiTest();
        String res01 = apiTest.queryUserInfo(111, 17);
        System.out.println("测试结果:" + res01 + "\r\n");;
    }

    public String queryUserInfo(int uId, int age) throws InterruptedException {
        return "你好,bugstack虫洞栈 | 精神小伙!";
    }

}

2. 配置javaagent

-javaagent:/Users/xiaofuge/itstack/git/github.com/SQM/target/SQM-1.0-SNAPSHOT.jar
  • IDEA 运行时候配置到 VM options 中,jar包地址按照自己的路径进行配置。

3. 被字节码增强后的方法

public String queryUserInfo(int var1, int var2) throws InterruptedException {
    long var3 = System.nanoTime();
    Object[] var6 = new Object[]{var1, var2};
    Object var7 = "你好,bugstack虫洞栈 | 精神小伙!";
    ProfilingAspect.point(var3, 0, var6, var7);
    return var7;
}
  • 通过编译后的方法可以看到,方法的执行信息全部通过静态方法输出到外部。这样就可以很方便的监控一个方法的执行信息。

4. 输出结果

ASM类输出路径:/Users/xiaofuge/itstack/git/github.com/SQM/target/test-classes/org/itstack/test/ApiTest$1SQM.class
监控 - Begin
类名org.itstack.test.ApiTest
方法queryUserInfo
入参类型:["I","I"]
入数[]:[111,17]
出参类型Ljava/lang/String;
出参[]:"你好,bugstack虫洞栈 | 精神小伙!"
耗时95(s)
监控 - End

测试结果你好bugstack虫洞栈 | 精神小伙

五、总结

📝 首页

🌏 知识星球码农会锁

实战项目:「DDD+RPC分布式抽奖系统」、专属小册、问题解答、简历指导、架构图稿、视频课程

🐲 头条

⛳ 目录

  1. 源码 - :octocat: 公众号:bugstack虫洞栈 文章所涉及到的全部开源代码
  2. Java
  3. Spring
  4. 面向对象
  5. 中间件
  6. Netty 4.x
  7. 字节码编程
  8. 💯实战项目
  9. 部署 Dev-Ops
  10. 📚PDF 下载
  11. 关于

💋 精选

🐾 友链

建立本开源项目的初衷是基于个人学习与工作中对 Java 相关技术栈的总结记录,在这里也希望能帮助一些在学习 Java 过程中遇到问题的小伙伴,如果您需要转载本仓库的一些文章到自己的博客,请按照以下格式注明出处,谢谢合作。

作者小傅哥
链接https://bugstack.cn
来源bugstack虫洞栈

2021年10月24日,小傅哥 的文章全部开源到代码库 CodeGuide 中,与同好同行,一起进步,共同维护。

这里我提供 3 种方式:

  1. 提出 Issue :在 Issue 中指出你觉得需要改进/完善的地方(能够独立解决的话,可以在提出 Issue 后再提交 PR )。
  2. 处理 Issue : 帮忙处理一些待处理的 Issue
  3. 提交 PR: 对于错别字/笔误这类问题可以直接提交PR,无需提交Issue 确认。

详细参考:CodeGuide 贡献指南 - 非常感谢你的支持,这里会留下你的足迹

  • 加群交流 本群的宗旨是给大家提供一个良好的技术学习交流平台,所以杜绝一切广告!由于微信群人满 100 之后无法加入,请扫描下方二维码先添加作者 “小傅哥” 微信(fustack),备注:加群。
微信:fustack

  • 公众号(bugstack虫洞栈) - 沉淀、分享、成长,专注于原创专题案例,以最易学习编程的方式分享知识,让自己和他人都能有所收获。
公众号:bugstack虫洞栈

感谢以下人员对本仓库做出的贡献或者对小傅哥的赞赏,当然不仅仅只有这些贡献者,这里就不一一列举了。如果你希望被添加到这个名单中,并且提交过 Issue 或者 PR,请与我联系。

Clone this wiki locally