Java面试题冲刺第六天--网络编程1

2022-07-22,,,,

目录
  • 面试题1:说一下tcp连接的三次握手和四次挥手吧
  • 面试题2:常见的http状态码有哪些?
    • 面试题3:先说说get和post请求有哪些区别吧?
          • 追问1:那get请求有request body么?如果有的话参数可以像post请求一样放在里面么?
          • 追问2:那你刚才说的url中传送参数的长度限制在get和post中都是怎么样的呢?
          • 追问3:那么你知道get、post请求发送的数据包有什么不同吗?

        面试题1:说一下tcp连接的三次握手和四次挥手吧

        正经回答:

        握手:tcp连接

        挥手:tcp断开

        三次握手:

        首先,三次握手的本质是确认通信双方(client端、server端)收发数据的能力

        三次握手其实就是指:建立一个tcp连接时,需要客户端和服务器总共发送3个包,通过这三个请求包,来确认双方(client、server)的接收能力和发送能力是否正常,同时,指定自己的初始化序列号为后面的可靠性传送做准备。实质上就是连接服务器指定端口,建立tcp连接,并同步连接双方的序列号和确认号,交换tcp窗口大小信息。

        注:刚开始客户端处于 closed 的状态,服务端处于 listen 状态。

        三次握手(连接)流程白话文介绍:

        我和女朋友养了一只信鸽来传信,今天我要试一试好不好使,不好使晚上我就准备吃烧烤。

        • 第一次握手:我把信(第一封信)绑在鸽子腿上发给女朋友,如果女朋友收到了,就确定了我的发件能力和她的收件能力没问题;
        • 第二次握手:然后女朋友给我回信(第二封信),我如果收到了,说明我的收件能力和她的发件能力没问题;
        • 第三次握手:然而此时女朋友还不知道她的发件能力和我的收件能力是否正常;因此我还要给他发(第三封信)说明,收到后最终决定晚上去吃烤鱼。信鸽:卧槽,真tm累,你们手机都是假的吧。

        三次握手理论流程:

        • 第一次握手:客户端将标志位syn置为1,随机产生一个值seq=j,并将该数据包发送给服务器端,客户端进入syn_sent状态,等待服务器端确认。
        • 第二次握手:服务器端收到数据包后由标志位syn=1知道客户端请求建立连接,服务器端将标志位syn和ack都置为1,ack=j+1,随机产生一个值seq=k,并将该数据包发送给客户端以确认连接请求,服务器端进入syn_rcvd状态。
        • 第三次握手:客户端收到确认后,检查ack是否为j+1,ack是否为1,如果正确则将标志位ack置为1,ack=k+1,并将该数据包发送给服务器端,服务器端检查ack是否为k+1,ack是否为1,如果正确则连接建立成功,客户端和服务器端进入established状态,完成三次握手,随后客户端与服务器端之间可以开始传输数据了。

        四次挥手:

        四次挥手即终止tcp连接,就是指断开一个tcp连接时,需要客户端和服务端总共发送4个包以确认连接的断开。在socket编程中,这一过程由客户端或服务端任一方执行close来触发。

        由于tcp连接是全双工的,因此,每个方向都必须要单独进行关闭,这一原则是当一方完成数据发送任务后,发送一个fin来终止这一方向的连接,收到一个fin只是意味着这一方向上没有数据流动了,即不会再收到数据了,但是在这个tcp连接上仍然能够发送数据,直到这一方向也发送了fin。首先进行关闭的一方将执行主动关闭,而另一方则执行被动关闭。

        四次挥手理论流程

        中断连接端可以是客户端,也可以是服务器端。

        第一次挥手:客户端发送一个fin=m,用来关闭客户端到服务器端的数据传送,客户端进入fin_wait_1状态。意思是说"我客户端没有数据要发给你了",但是如果你服务器端还有数据没有发送完成,则不必急着关闭连接,可以继续发送数据。

        第二次挥手:服务器端收到fin后,先发送ack=m+1,告诉客户端,你的请求我收到了,但是我还没准备好,请继续你等我的消息。这个时候客户端就进入fin_wait_2 状态,继续等待服务器端的fin报文。

        第三次挥手:当服务器端确定数据已发送完成,则向客户端发送fin=n报文,告诉客户端,好了,我这边数据发完了,准备好关闭连接了。服务器端进入last_ack状态。

        第四次挥手:客户端收到fin=n报文后,就知道可以关闭连接了,但是他还是不相信网络,怕服务器端不知道要关闭,所以发送ack=n+1后进入time_wait状态,如果server端没有收到ack则可以重传。服务器端收到ack后,就知道可以断开连接了。客户端等待了2msl后依然没有收到回复,则证明服务器端已正常关闭,那好,我客户端也可以关闭连接了。最终完成了四次握手。

        深入追问:

        追问1:为什么连接的时候是三次握手,关闭的时候却是四次握手?

        因为当server端收到client端的syn连接请求报文后,可以直接发送syn+ack报文。其中ack报文是用来应答的,syn报文是用来同步的。但是关闭连接时,当server端收到fin报文时,很可能并不会立即关闭socket,所以只能先回复一个ack报文,告诉client端,“你发的fin报文我收到了”。只有等到我server端所有的报文都发送完了,我才能发送fin报文,因此不能一起发送。故需要四步握手。

        追问2:如果已经建立了连接,但是客户端突然出现故障了怎么办?

        tcp还设有一个保活计时器,显然,客户端如果出现故障,服务器不能一直等下去,白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。

        若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。

        面试题2:常见的http状态码有哪些?

        正经回答:

        http状态码表示客户端http请求的返回结果、标识服务器处理是否正常、表明请求出现的错误等。

        状态码的类别:

        状态码 原因
        1xx informational(信息性状态码) 接受的请求正在处理
        2xx success(成功状态码) 请求正常处理完毕
        3xx redirection(重定向状态码) 需要进行附加操作以完成请求
        4xx client error(客户端错误状态码) 服务器无法处理请求
        5xx server error(服务器错误状态码) 服务器处理请求出错
        状态码 原因
        2xx 成功(这系列表明请求被正常处理了)
        200 ok,表示从客户端发来的请求在服务器端被正确处理
        204 no content,表示请求成功,但响应报文不含实体的主体部分
        206 partial content,进行范围请求成功
        状态码 原因
        3xx 重定向(表明浏览器要执行特殊处理)
        301 moved permanently,永久性重定向,表示资源已被分配了新的 url
        302 found,临时性重定向,表示资源临时被分配了新的 url
        303 see other,表示资源存在着另一个 url,应使用 get 方法获取资源
        304 not modified,表示服务器允许访问资源,但请求未满足条件的情况(与重定向无关)
        307 temporary redirect,临时重定向,和302含义类似,但是期望客户端保持请求方法不变向新的地址发出请求
        状态码 原因
        4xx 客户端错误
        400 bad request,请求报文存在语法错误
        401 unauthorized,表示发送的请求需要有通过 http 认证的认证信息
        403 forbidden,表示对请求资源的访问被服务器拒绝,可在实体主体部分返回原因描述
        404 not found,表示在服务器上没有找到请求的资源
        状态码 原因
        5xx 服务器错误
        500 internal sever error,表示服务器端在执行请求时发生了错误
        501 not implemented,表示服务器不支持当前请求所需要的某个功能
        503 service unavailable,表明服务器暂时处于超负载或正在停机维护,无法处理请求

        面试题3:先说说get和post请求有哪些区别吧?

        正经回答:

        get请求在url中传送的参数是有长度限制的,而post没有。

        get比post更不安全,因为参数直接暴露在url上,所以不能用来传递敏感信息。而post数据不会显示在url中。是放在request body中。

        对参数的数据类型,get只接受ascii字符,而post没有限制。

        get请求参数会被完整保留在浏览器历史记录里;相反,post请求参数也不会被浏览器保留。

        get请求只能进行url编码(application/x-www-form-urlencoded),而post支持多种编码方式。

        get请求会被浏览器主动缓存,而post不会,除非手动设置。

        get在浏览器回退时是无害的,而post会再次提交请求。

        深入追问:

        追问1:那get请求有request body么?如果有的话参数可以像post请求一样放在里面么?

        其实吧,get和post在本质上没有区别,都是http协议中的两种发送请求的方法。而http呢,是基于tcp/ip的关于数据如何在万维网中如何通信的协议。

        万维网:简称www,是world wide web的简称,也称为web、3w等

        http的底层是tcp/ip。所以get和post的底层也是tcp/ip,也就是说,get/post都是tcp链接。

        get和post能做的事情是一样一样的。你要给get加上request body,给post带上url参数,技术上是完全行的通的。

        • 举个例子吧:

        tcp就像汽车,我们用tcp来运输数据,它很可靠,从来不会发生丢件少件的现象。

        但是如果路上跑的全是看起来一模一样的汽车,那这个世界看起来是一团混乱,送急件的汽车可能被前面满载货物的汽车拦堵在路上,整个交通系统一定会瘫痪。

        为了避免这种情况发生,交通规则http诞生了。http给汽车运输设定了好几个服务类别,包括get, post, put等等,

        http规定,当执行get请求的时候,要给汽车贴上get的标签(设置method为get),而且要求把传送的数据放在车顶上(url中)以方便记录。

        如果是post请求,就要在车上贴上post的标签,并把货物放在车厢里(request body中)。

        当然,你也可以在用get的时往车厢内偷偷藏点货物,但这并不不光彩;也可以在post的时候在车顶上也放一些数据,也会让人觉得傻乎乎的。

        http只是个行为准则,而get和post本质上就是tcp链接,并无差别。但是由于http的规定和浏览器/服务器的限制,导致他们在应用过程中体现出一些不同。

        追问2:那你刚才说的url中传送参数的长度限制在get和post中都是怎么样的呢?

        其实在web中啊,还有另一个重要的角色:运输公司。

        不同的浏览器client端(发起http请求)和服务器server端(接受http请求)就是不同的运输公司。

        虽然理论上,你可以在车顶上无限的堆货物(url中无限加参数)。但是运输公司可不傻,装货和卸货也是有很大成本的,他们会限制单次运输量来控制风险,数据量太大对浏览器和服务器都是很大负担。

        业界不成文的规定是:(大多数)浏览器通常都会限制url长度在2k个字节,而(大多数)服务器最多处理64k大小的url。

        超过的部分,恕不处理。如果你用get服务,在request body偷偷藏了数据,不同服务器的处理方式也是不同的,有些服务器会帮你卸货,读出数据,有些服务器直接忽略。

        所以,虽然get可以带request body,却不能保证一定能被接收到。

        我之前处理过一个bug,用户反应查询没有响应,同事查了日志后才发现有几个参数都是undefined,很奇怪,最后发现原来是因为get请求第一个查询参数太长了,导致url后面的部分服务器无法接收 ,后来把请求改成post,将参数放在request body后就可以了。

        追问3:那么你知道get、post请求发送的数据包有什么不同吗?

        嗯嗯,是这样的,get请求时产生一个tcp数据包;post请求时产生两个tcp数据包。

        • get:浏览器会把http header和data一并发送出去,服务器响应200(返回数据);
        • post:浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。

        就像是get只需要汽车跑一趟就把货送到了,而post得跑两趟,第一趟,先去和服务器打个招呼“老铁,我等下要送一批货来,你们准备接收一下哈”,然后再回头把货送过去。

        因为post需要两步,理论上时间上消耗的要多一点,看起来get比post更有效。但并不是,后来发现原来是个坑。在我看来:

        1.get与post都有自己的语义,不能随便混用。

        2.据研究,在网络环境好的情况下,发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下,两次包的tcp在验证数据包完整性上,有非常大的优点。

        3.并不是所有浏览器都会在post中发送两次包,firefox就只发送一次。我去年用chrome浏览器测试发现也是只发送一次,所以我认为get、post性能差可以人为忽略。

        总结

        本篇文章就到这里了,希望能给你带来帮助,也希望您能够多多关注的更多内容!

        《Java面试题冲刺第六天--网络编程1.doc》

        下载本文的Word格式文档,以方便收藏与打印。