netty报文解析之粘包半包问题

2023-09-22 14:37:42
粘包问题

Netty 的粘包问题是指在网络传输过程中,由于 TCP 协议本身的特点,导致发送方发送的若干个小数据包被接收方合并成了一个大数据包。这种情况称为粘包。

TCP 协议是面向流的协议,没有数据边界,发送方发送的数据可能会被分成多个数据包进行发送,接收方则需要将这些数据包重新组装为原始数据。当接收方处理不当时,就可能会发生粘包等问题。

造成粘包问题的原因主要有以下几点:

  1. 传输的数据量过大或者传输速度过快。
  2. 数据包长度不固定,或者协议自定义导致变长。
  3. 接收方的读取缓存区大小设置不当。

解决粘包问题的方法有很多种,其中比较常用的方式包括以下几点:

  1. 定长解码器:针对长度固定的数据包,采用定长的编码和解码方式,可以有效避免粘包问题。
  2. 分隔符解码器:使用特定字符或字符串作为数据包的分隔符,在接收方收到分隔符时进行消息的解码。
  3. 消息头加长度字段:在数据包中添加一部分用来表示数据包长度的信息,以便于接收方进行消息的解码和切割。
  4. 自定义协议:设计自己的消息传输协议,包括消息格式、头部、长度字段等,来解决粘包问题。
半包问题

半包问题是指在网络传输过程中,接收方无法完整地接收到一个数据包,而只接收到了部分数据包的情况。这种情况称为半包。

造成半包问题的主要原因是数据包的长度超过了接收方的缓存区大小,导致接收方无法一次性接收完整的数据包。协议设计不合理、网络延迟等也可能引起半包问题。

解决半包问题方法和解决粘包问题基本一致。

下面看下具体的例子

定长报文

定长报文就是收发双方约定一次通信的报文长度是固定长度的,服务端按照规定长度接收,客户端按照固定长度返送。这里主要用到FixedLengthFrameDecoder解码器,其构造函数有一个入参来指定报文的长度。

server:

pipeline.addLast(new FixedLengthFrameDecoder(1024))

发送数据

// 消息解析
ByteBuf buf = (ByteBuf) msg;
byte[] bytes = new byte[buf.readableBytes()];
buf.readBytes(bytes);
String receivedMessage = new String(bytes, "UTF-8");
System.out.println("接收到消息:" + receivedMessage);
// 发送响应
String responseMessage = "Response";
byte[] responseBytes = responseMessage.getBytes("UTF-8");
ByteBuf responseBuf = ctx.alloc().buffer(responseBytes.length);
responseBuf.writeBytes(responseBytes);
ctx.writeAndFlush(responseBuf);

// 释放资源
buf.release();

client:

客户端只要每次发送按约定长度组装报文即可

固定长度头

固定长度头就是报文整体有两部分组成:报文头+报文体。齐总报文头是固定位置长度,里面会表明报文体长度,消息接收方先定长读取报文头,然后根据报文头指定的报文体长度来定量读取报文体。

这里用到了LengthFieldBasedFrameDecoder解码器。

该解析其有几个重要参数:

maxFrameLength:最大消息长度,报文最大长度

lengthFieldOffset:长度字段的偏移量,如有些报文可能报文头上还有一些其它的标识位,可以将这些标识位跳过

lengthFieldLength:长度字段的长度

lengthAdjustment:长度调整值,这个值也有一定的用处。有些情况长度标识的是包含header头的长度,这个时候可以将该值配置成负数,最后继续往后解析的长度是:lengthFieldLength+lengthAdjustment

initialBytesToStrip:从开始位置截取掉的字节长度,可以把header去掉再往后传给下一个handler,不过一般会保留报文头,业务代理再去解析。LengthFieldBasedFrameDecoder只负责报文接收完整。

整个处理流程:

当接收到来自网络的字节流时,LengthFieldBasedFrameDecoder 首先根据指定的 lengthFieldOffset 和 lengthFieldLength 定位长度字段的位置,并读取长度字段的值。

接下来,根据读取到的长度字段值计算出消息的长度。如果消息的长度超过了指定的 maxFrameLength,则会触发异常处理机制。

如果消息的长度合法,则 LengthFieldBasedFrameDecoder 会读取接下来的指定长度的字节,构成一个完整的消息。

最后,根据配置的 initialBytesToStrip 参数,可以选择是否去除消息长度头。

解码器完成后,将解析出的完整消息传递给下一个处理器进行进一步的处理。

用例:

如我们定义以下一种报文:

长度头(4字节,只是报文体长度)+标识位(1字节)+报文体长度。

则创建LengthFieldBasedFrameDecoder要指定。

lengthFieldOffset=0,lengthFieldLength=4,lengthAdjustment=1,initialBytesToStrip=0(保留报文头)

具体代码:

server端pipeline添加LengthFieldBasedFrameDecoder解码器和FixedLengthServerHandler

pipeline.addLast(new LengthFieldBasedFrameDecoder(1024,0,4,1,0));
pipeline.addLast(new FixedLengthServerHandler());

FixedLengthServerHandler处理方法如下:

public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
    ByteBuf buf = (ByteBuf) msg;

    //消息解析
    int length = buf.readInt();
    byte[] bytes = new byte[length];
    char flag = (char) buf.readByte();
    buf.readBytes(bytes);
    String receivedMessage = new String(bytes, "UTF-8");
    System.out.println("接收到消息:" + receivedMessage+",消息标识:"+flag);

    // 发送响应
    String responseMessage = "SUCC";
    byte[] responseBytes = responseMessage.getBytes("UTF-8");
    int responseLength = responseBytes.length;
    ByteBuf responseBuf = ctx.alloc().buffer(4 +1+ responseLength);
    responseBuf.writeInt(responseLength);
    responseBuf.writeBytes("Y".getBytes());
    responseBuf.writeBytes(responseBytes);
    ctx.writeAndFlush(responseBuf);

    buf.release();
}

client端:

同样的pipeline添加两个handler

pipeline.addLast(new LengthFieldBasedFrameDecoder(1024,0,4,1,0));
pipeline.addLast(new FixedLengthClientHandler());

构造消息发送:

ByteBuf buffer = Unpooled.buffer();
byte[] bytes = "hello".getBytes();
buffer.writeInt(bytes.length);
buffer.writeBytes("X".getBytes());
buffer.writeBytes(bytes);
channel.writeAndFlush(buffer);

FixedLengthClientHandler处理响应报文:

public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
    ByteBuf buf = (ByteBuf) msg;

    // 消息处理
    int length = buf.readInt();
    char flag = (char) buf.readByte();
    byte[] bytes = new byte[length];
    buf.readBytes(bytes);
    String receivedMessage = new String(bytes, "UTF-8");
    System.out.println("接收到消息:" + receivedMessage+",flag="+flag);
    buf.release();
}

另外这里处理的都是字节流数据,使用原先阻塞BIO socket也是可以的,不局限于ByteBuf。

如socket发送接收上面定长报文头数据:

Socket socket = new Socket("localhost", 8080);
OutputStream outputStream = socket.getOutputStream();
InputStream inputStream = socket.getInputStream();

// 发送消息
String message = "Hello";
byte[] data = message.getBytes();

ByteBuffer buffer = ByteBuffer.allocate(4);
buffer.putInt(data.length);

outputStream.write(buffer.array());
outputStream.write("X".getBytes());
outputStream.write(data);
outputStream.flush();
//接收响应
byte[] lenB = new byte[4];
inputStream.read(lenB);
char flag = (char) inputStream.read();
ByteBuffer buff = ByteBuffer.wrap(lenB);
int len = buff.getInt();

byte[] resp = new byte[len];
inputStream.read(resp);
System.out.println("响应:"+new String(resp) +",flag="+flag);

outputStream.close();
inputStream.close();
socket.close();
分隔符报文

分隔符报文就是将报文按固定字符进行分割,这里使用DelimiterBasedFrameDecoder 解析器。

入参可指定分隔符及最大报文长度。

与之相似的还有LineBasedFrameDecoder按行读取,就是以 '\n’换行符当作分隔符。

自定义报文

基本上LengthFieldBasedFrameDecoder解码器已经满足解决报文粘包问题,如果还有其它比较复杂的报文,可以自定义协议报文格式进行处理,一个基本原则还是要有一个报文长度标识,然后按具体长度进行读取。

更多推荐

每日一练 | 华为认证真题练习Day114

1、如图所示,交换机GE0/0/1和GE0/0/2两个端口都进行不同的此Hybrid配置,下面说法正确是()。(多选)A.财务部门发出的数据帧在交换机中携带的Tag为VLAN20B.行政部门和财务部门不能互访,因为两部门所属的VLAN不相同C.如果交换机的GE0/0/1和GE0/0/2两个端口都修改为Trunk端口,则

头歌平台 | 逻辑函数及其描述工具logisim使用

文章目录1、根据布尔表达式绘制电路2、根据真值表绘制电路3、根据简化真值表绘制电路4、根据波形图绘制电路5、根据卡诺图绘制电路1、根据布尔表达式绘制电路任务描述本关任务:在Logisim中根据给定的布尔代数表达式(F=AB+BC+CA)绘制逻辑电路。案例场景举例举重比赛裁判电路。在举重比赛中,通常有三位裁判(A、B、C

【SQL数据分析 | 手把手教你做淘宝用户分析!】

SQL也能做分析?当然!常见的数据清洗,预处理,数据分类,数据筛选,分类汇总,以及数据透视等操作,用SQL一样可以实现(除了可视化,需要放到Excel里呈现)。SQL不仅可以从数据库中读取数据,还能通过不同的SQL函数语句直接返回所需要的结果,从而大大提高了自己在客户端应用程序中计算的效率。但是,这个过程需要很熟练掌握

TypeScript入门

目录一:语言特性二:TypeScript安装NPM安装TypeScript三:TypeScript基础语法第一个TypeScript程序四:TypeScript保留关键字空白和换行TypeScript区分大小写TypeScript注释TypeScript支持两种类型的注释五:TypeScript与面向对象六:TypeS

如何使用ChatGPT,而不是生成默认风格的八股文

现在我每天都使用ChatGPT来执行多项任务,包括但不限于内容创建。无论是编写文本还是与我讨论我的业务目标,ChatGPT总是会时不时的用到。但与所有强大的工具一样,ChatGPT和类似的大型语言模型(LLM)也有其局限性。在我从事人工智能工作的过程中,我多次偶然发现它们。如果您在业务中依赖ChatGPT而不了解其局限

正则表达式 - 语法

目录正则表达式-语法普通字符测试工具非打印字符特殊字符限定符定位符选择以下列出?=、?<=、?!、?反向引用实例实例正则表达式-语法正则表达式是一种用于匹配和操作文本的强大工具,它是由一系列字符和特殊字符组成的模式,用于描述要匹配的文本模式。正则表达式可以在文本中查找、替换、提取和验证特定的模式。例如:runoo+b,

125. 验证回文串 【简单题】

题目如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后,短语正着读和反着读都一样。则可以认为该短语是一个回文串。字母和数字都属于字母数字字符。给你一个字符串s,如果它是回文串,返回true;否则,返回false。示例1:输入:s="Aman,aplan,acanal:Panama"输出:true解释:"a

amlogic 机顶盒关闭DLNA 后,手机还能搜到盒子

S905L3带有投屏的功能,并通过com.droidlogic.mediacenter.dlna.MediaCenterService服务的启动和停止来开启和关闭DLNA功能,但是在测试中发现机顶盒关闭DLNA后,手机还能搜索到盒子。我在复测中发现关闭后有时很难很久搜索到盒子,有时却很容易搜索到。通过查看日志,发现打开

C语言每日一题(10):无人生还

文章主题:无人生还🔥所属专栏:C语言每日一题📗作者简介:每天不定时更新C语言的小白一枚,记录分享自己每天的所思所想😄🎶个人主页:[₽]的个人主页🏄🌊目录前言编程起因项目介绍情节简介讨论内容找出凶手设计思路1.整体逻辑方法一方法二2.具体逻辑方法一方法二代码展示方法一:依次假设法(最容易想到的方法)方法二:逻

【ABAP】如何理解SAP中的CLIENT (客户端)

💂作者简介:THUNDER王,阿里云社区专家博主,华为云·云享专家,腾讯云社区认证作者,CSDNSAP应用技术领域优质创作者。在学习工作中,我通常使用偏后端的开发语言ABAP,SQL进行任务的完成,对SAP企业管理系统,SAPABAP开发和数据库具有较深入的研究。💅文章概要:MANDT集团永远是无数SAP入门人员无

【STM32】SDIO—SD 卡读写01

基于stm32f103基于零死角玩转STM32—F103指南者简介1.SD卡总共有8个寄存器,用于设定或表示SD卡信息。2.SD卡的寄存器不能像STM32那样访问,而是利用命令访问,SDIO定义了64个命令。SD卡接收到命令后,根据命令要求对SD卡内部寄存器进行修改,程序控制中只需要发送组合命令就可以实现SD卡的控制以

热文推荐