TCP/IP协议族详解（二）

20 Mar 2018 2609字 9分
CC BY 4.0 （除特别声明或转载文章外）

本系列文章是教程：TCP、IP协议族详解的学习笔记。

该系列大概分为下面几个部分：

1、TCP/IP协议4层结构以及每层的作用
2、IP协议详解
3、ARP协议和RARP协议详解
4、ICMP协议详解
5、TCP协议详解
6、UDP协议详解

本文主要介绍TCP/IP网络体系中网络层的IP协议。

1、IP协议的功能

IP协议属于网络层众多协议中，最核心的一个协议。它的主要功能有三个：

寻址和路由
传递服务，有两个特点：不可靠（可靠性由上层协议提供，例如TCP协议）；无连接
数据报分段（Segment）和重组

什么是寻址和路由？

举一个生活中的例子：假如我要坐火车从广州到北京，选择的路线有很多种，可以坐京广线、也可以先到南昌，然后再去上海，最后去北京等等。怎么选择路线就类似IP协议的寻址和路由。

为什么传递数据不可靠？

IP协议一个重要的原则就是：尽最大可能传递数据，但是数据能不能真的到达目的地，IP协议并没有保证。

数据报分段和重组

同样一个生活中的例子：如果要运送一个很大的机器，一次性无法运送完，通常的做法是，拆分后把零部件运送到目的地，当所有的零部件都到达目的地后，最后在目的地进行重新组装。

2、IP协议头部格式

IP协议头部格式可以分为两个部分：固定部分（20byte）和可变部分（最大可以为40byte）。所以，IP协议的头部最大是60个字节，但是一般情况下都没有可变部分。

下图为IP协议头部格式：

下面，我结合wireshark抓包工具，介绍下IP协议头部固定部分的每个字段的详细意义：

1、使用wireshark抓一个http包，访问的是: http://www.qq.com，结果如下图所示抓包结果

可以看到后面的二进制数据，这就是IP协议报文的首部，一共20个字节，其中没有可选部分。抓包结果

2、详细解释每个字段的意义

第1个字节：值为45(16进制，以下同理)，高四位用来表示IP协议的版本，这里也就是：0100 .... = Version 4,低四位用来表示头部长度（注意：单位是4byte），在这里为5(0101)，也就是：.... 0101 = Header Lenght: 20 bytes（5），即4(byte)*5=20(byte)
第2个字节：值为00，也就是图中的：Differentiated Services Field:0x00，用来获得更好的服务，这个字段以前一直没有被人们使用，这个字段不作详细的解释，只需要知道DTRC，这几个标志只能同时存在一个。但是目前这个字段的使用有些变化，具体也不做详解。
第3、4个字节(2byte)：值为04 0e，也就是十进制1038，也就是图中的：Total Length: 1038，表示数据的总长度（IP头部+数据长度，单位为字节），同时，我们可以根据这个数值以及前面的头部长度，计算得出数据包的长度为：1038-20 = 1018byte。另外，也可以知道数据报的最大长度为 65535 字节。
第5、6个字节：值4c9b，图中为:Identification: 0x4c9b(19611)，它是一个计数器，用来产生数据报的标识，它相当于是给IP报文的一个身份证。比如上面运送大型机器的例子，我们在每个运送零部件上贴一个标识，表示它是属于某个机器的（比如说是挖掘机），等所有的零部件都到了后，我们可以根据这个标示，就知道这一批零件是挖掘机的。
第7、8个字节：值为4000，这里的16个比特要特殊分配下，高三位为标示字段(图中为：Flags:0x02 （Don't Fragment）)，低13位为片偏移（图中为：Fragment offset:0）。
- 目前标示字段(Flags)只有后两个比特有意义。标志字段的最低位是 MF (More Fragment)。MF=1 表示后面“还有分片”。MF = 0 表示最后一个分片。标志字段中间的一位是 DF (Don’t Fragment) 。只有当 DF = 0 时才允许分片，DF=1表示不允许分片。这里的值为:010(二进制)，也就是没有分片，因为数据只有1038byte，一个IP报文就能运送完毕，所以，它不需要分片。
- 较长的分组在分片后某片在原分组中的相对位置。片偏移以 8个字节 为偏移单位。关于片偏移，下面会有一张图，会更加详细的描述其意义。这里值为00 0000，因为这里没有分片，所以它的片偏移也就是0。
第9个字节：值为40，也就是10进制的64，它表示TTL（Time to Live），图中为：Time to Live:64，也就是这个IP报文在网络中存在的时间，现在用“跳”作为TTL的单位，也就是说数据报每经过一个路由器，其TTL值就减一。为什么需要TTL？它主要是为了处理路由环路。
可以通过ping命令，例如：ping www.baidu.com，显示：来自 14.215.177.38 的回复: 字节=32 时间=8ms TTL=54，这里的TTL就表示这个ping命令返回的IP报文的TTL为54，假如TTL最大值为64，也就是说这个IP报文经过了64-54=10个路由节点。
第10个字节：值为06，表示上层协议类型，也就是这里的：Protocol: TCP(6)
第11、12个字节：值为0000，因为wireshark默认没有开启这个功能，所以这里显示0000。它只是检验数据报的首部不包括数据部分。
第13到16个字节：值为c0 a8 02 67（也就是ip地址192.168.2.103），表示源IP地址
第17到20个字节：值为oe 11 2a 28（也就是ip地址14.17.42.40），表示目的IP地址

3、IP 数据报首部的可变部分

IP 首部的可变部分就是一个选项字段，用来支持排错、测量以及安全等措施，内容很丰富
选项字段的长度可变（最大40byte），取决于所选择的项目，增加首部的可变部分是为了增加 IP 数据报的功能，但这同时也使IP 数据报的首部长度成为可变的。这就增加了每一个路由器处理数据报的开销
实际上这些选项很少被使用

4、IP数据分片规则

如果一个IP包的数据部分太大，比如超过了65535byte，那么就需要分割成多个IP包发送出去，也就是IP包分片。分片是以8个byte为单位，也就是说一个片为8个字节。

例如：下图要把3800个字节的数据分为3个IP包发出去，第一个包的片偏移为0，第二个包发送的数据是从索引1400（也就是第1401个byte开始），第三个从索引2800处开始。那么每个包的片偏移值 = 数据起始索引值/8。

IP包分片