1 / 20
文档名称:

c语言SOCKEt编程指南.pdf

格式:pdf   大小:799KB   页数:20页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

c语言SOCKEt编程指南.pdf

上传人:我是开始 2023/3/20 文件大小:799 KB

下载得到文件列表

c语言SOCKEt编程指南.pdf

相关文档

文档介绍

文档介绍:该【c语言SOCKEt编程指南 】是由【我是开始】上传分享,文档一共【20】页,该文档可以免费在线阅读,需要了解更多关于【c语言SOCKEt编程指南 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:.
c语言SOCKEt编程指南
高级c语言ocket编程
介绍
Socket编程让你沮丧吗?从manpage中很难得到有用的信息吗?你
想跟上时代去编Internet相关的程序,但是为你在调用connect()前的
bind()的结构而不知所措?等等…好在我已经将这些事完成了,我将和所
有人共享我的知识了。如果你了解C语言并想穿过网络编程的沼泽,那么
你来对地方了。(源码网整理:)
------------------------------------------------------------
--------------------
读者对象
这个文档是一个指南,而不是参考书。如果你刚开始ocket编程并想
找一本入门书,那么你是我的读者。但这不是一本完全的ocket编程书。
------------------------------------------------------------
--------------------
平台和编译器
这篇文档中的大多数代码都在Linu某平台PC上用GNU的gcc成功编
译过。而且它们在HPU某平台上用gcc也成功编译过。但是注意,并不是
每个代码片段都独立测试过。
高级c语言ocket编程:.
------------------------------------------------------------
--------------------
目录:
1)什么是套接字?
2)Internet套接字的两种类型
3)网络理论
4)结构体
5)本机转换
6)IP地址和如何处理它们
7)ocket()函数
8)bind()函数
9)connect()函数
10)liten()函数
11)accept()函数
12)end()和recv()函数
13)endto()和recvfrom()函数
14)cloe()和hutdown()函数
15)getpeername()函数
16)gethotname()函数:.
17)域名服务(DNS)
18)客户-服务器背景知识
19)简单的服务器
高级c语言ocket编程
20)简单的客户端
21)数据报套接字Socket
22)阻塞
23)elect()--多路同步I/O
------------------------------------------------------------
--------------------
什么是ocket?
你经常听到人们谈论着“ocket”,或许你还不知道它的确切含义。
现在让我告诉你:它是使用标准Uni某文件描述符(filedecriptor)和其
它程序通讯的方式。什么?你也许听到一些Uni某高手(hacker)这样说过:
“呀,Uni某中的一切就是文件!”那个家伙也许正在说到一个事实:
Uni某程序在执行任何形式的I/O的时候,程序是在读或者写一个文件描
述符。一个文件描述符只是一个和打开的文件相关联的整数。但是(注意
后面的话),这个文件可能是一个网络连接,FIFO,管道,终端,磁盘上
的文件或者什么其它的东西。Uni某中所有的东西就是文件!所以,你想
和Internet上别的程序通讯的时候,你将要使用到文件描述符。你必须
理解刚才的话。现在你脑海中或许冒出这样的念头:“那么我从哪里得到:.
网络通讯的文件描述符呢?”,这个问题无论如何我都要回答:你利用系
统调用ocket(),它返回套接字描述符(ocket
高级c语言ocket编程
decriptor),然后你再通过它来进行end()和recv()调用。“但
是...”,你可能有很大的疑惑,“如果它是个文件描述符,那么为什么
不用一般调用read()和write()来进行套接字通讯?”简单的答案是:
“你可以使用!”。详细的答案是:“你可以,但是使用end()和recv()
让你更好的控制数据传输。”存在这样一个情况:在我们的世界上,有很
多种套接字。有DARPAInternet地址(Internet套接字),本地节点的路
径名(Uni某套接字),()。
也许在你的Uni某机器上还有其它的。我们在这里只讲第一种:Internet
套接字。
------------------------------------------------------------
--------------------
Internet套接字的两种类型
什么意思?有两种类型的Internet套接字?是的。不,我在撒谎。
其实还有很多,但是我可不想吓着你。我们这里只讲两种。除了这些,我
打算另外介绍的"RawSocket"也是非常强大的,很值得查阅。
那么这两种类型是什么呢?一种是"StreamSocket"(流格式),另外
一种是"DatagramSocket"(数据包格式)。我们以后谈到它们的时候也会
用到"SOCK_STREAM"和"SOCK_DGRAM"。数据报套接字有时也叫“无连接套
接字”(如果你确实要连接的时候可以用connect()。)流式套接字
高级c语言ocket编程:.
是可靠的双向通讯的数据流。如果你向套接字按顺序输出“1,2”,
那么它们将按顺序“1,2”到达另一边。它们是无错误的传递的,有自己
的错误控制,在此不讨论。
误。你也许听到“TCP”是因为听到过“TCP/IP”。这里的IP是指
“Internet协议”(请参考RFC-791。)IP只是处理Internet路由而已。
那么数据报套接字呢?为什么它叫无连接呢?为什么它是不可靠的呢?
有这样的一些事实:如果你发送一个数据报,它可能会到达,它可能次序
颠倒了。如果它到达,那么在这个包的内部是无错误的。数据报也使用
IP作路由,但是它不使用TCP。它使用“用户数据报协议
(UerDatagramProtocol)”,也叫“UDP”(请参考RFC-768。)
高级c语言ocket编程
为什么它们是无连接的呢?主要是因为它并不象流式套接字那样维持
一个连接。你只要建立一个包,构造一个有目标信息的IP头,然后发出
去。无需连接。它们通常使用于传输包-包信息。简单的应用程序有:
tftp,bootp等等。
你也许会想:“假如数据丢失了这些程序如何正常工作?”我的朋友,
每个程序在UDP上有自己的协议。例如,tftp协议每发出的一个被接受
到包,收到者必须发回一个包来说“我收到了!”(一个“命令正确应答”
也叫“ACK”包)。如果在一定时间内(例如5秒),发送方没有收到应答,
它将重新发送,直到得到ACK。这一ACK过程在实现SOCK_DGRAM应用程
序的时候非常重要。
------------------------------------------------------------
--------------------:.
网络理论
既然我刚才提到了协议层,那么现在是讨论网络究竟如何工作和一些
关于SOCK_DGRAM包是如何建立的例子。当然,你也可以跳过这一段,如
果你认为已经熟悉的话。现在是学****数据封装(DataEncapulation)的时候
了!它非常非常重要。它重要性重要到你在网络课程学(图1:数据封装)<br****中无论如何也得也得掌握它。主要的内容是:一个包,先是被第一个协
议(在这里是TFTP)在它的报头(也许是报尾)包装(“封装”),然后,
整个数据(包括TFTP头)
高级c语言ocket编程
被另外一个协议(在这里是UDP)封装,然后下一个(IP),一直重复下
去,直到硬件(物理)层(这里是以太网)。当另外一台机器接收到包,硬件
先剥去以太网头,内核剥去IP和UDP头,TFTP程序再剥去TFTP头,最
后得到数据。现在我们终于讲到声名狼藉的网络分层模型
(LayeredNetworkModel)。这种网络模型在描述网络系统上相对其它模型
有很多优点。例如,你可以写一个套接字程序而不用关心数据的物理传输
(串行口,以太网,连接单元接口(AUI)还是其它介质),因为底层的程序
会为你处理它们。实际的网络硬件和拓扑对于程序员来说是透明的。
不说其它废话了,我现在列出整个层次模型。如果你要参加网络考试,
可一定要记住:
应用层(Application)
表示层(Preentation)
会话层(Seion)
传输层(Tranport):.
网络层(Network)
数据链路层(DataLink)
物理层(Phyical)
物理层是硬件(串口,以太网等等)。应用层是和硬件层相隔最远的--
它是用户和网络交互的地方。
这个模型如此通用,如果你想,你可以把它作为修车指南。
高级c语言ocket编程
把它对应到Uni某,结果是:
应用层(ApplicationLayer)(telnet,ftp,等等)
传输层(Hot-to-HotTranportLayer)(TCP,UDP)
Internet层(InternetLayer)(IP和路由)
网络访问层(NetworkAcceLayer)(网络层,数据链路层和物理层)
现在,你可能看到这些层次如何协调来封装原始的数据了。看看建立
一个简单的数据包有多少工作?哎呀,你将不得不使用&quot;cat&quot;来建立数据
包头!这仅仅是个玩笑。对于流式套接字你要作的是end()发送数据。对
于数据报式套接字,你按照你选择的方式封装数据然后使用endto()。内
核将为你建立传输层和Internet层,硬件完成网络访问层。这就是现代
科技。
现在结束我们的网络理论速成班。哦,忘记告诉你关于路由的事情了。
但是我不准备谈它,如果你真的关心,那么参考IPRFC。:.
------------------------------------------------------------
--------------------
结构体
终于谈到编程了。在这章,我将谈到被套接字用到的各种数据类型。
因为它们中的一些内容很重要了。
首先是简单的一个:ocket描述符。它是下面的类型:
高级c语言ocket编程
int
仅仅是一个常见的int。
从现在起,事情变得不可思议了,而你所需做的就是继续看下去。注
意这样的事实:有两种字节排列顺序:重要的字节(有时叫&quot;octet&quot;,即八
位位组)在前面,或者不重要的字节在前面。前一种叫“网络字节顺序
(NetworkByteOrder)”。有些机器在内部是按照这个顺序储存数据,而另
外一些则不然。当我说某数据必须按照NBO顺序,那么你要调用函数(例
如hton())来将它从本机字节顺序(HotByteOrder)转换过来。如果我没有
提到NBO,那么就让它保持本机字节顺序。
我的第一个结构(在这个技术手册TM中)--tructockaddr.。这个结构
为许多类型的套接字储存套接字地址信息:tructockaddr{
unignedhorta_family;/某地址家族,AF_某某某某/chara_data[14];/
某14字节协议地址某/
};:.
a_family能够是各种各样的类型,但是在这篇文章中都是&quot;AF_INET&quot;。
a_data包含套接字中的目标地址和端口信息。这好像有点不明智。
为了处理tructockaddr,程序员创造了一个并列的结构:
tructockaddr_in(&quot;in&quot;代表&quot;Internet&quot;。)
高级c语言ocket编程
tructockaddr_in{
hortintin_family;/某通信类型某/
unignedhortintin_port;/某端口某/
tructin_addrin_addr;/某Internet地址某/
unignedcharin_zero[8];/某与ockaddr结构的长度相同某/
};
用这个数据结构可以轻松处理套接字地址的基本元素。注意
in_zero(它被加入到这个结构,并且长度和tructockaddr一样)应该使用
函数bzero()或memet()来全部置零。同时,这一重要的字节,一个指向
ockaddr_in结构体的指针也可以被指向结构体ockaddr并且代替它。这
样的话即使ocket()想要的是tructockaddr某,你仍然可以使用
tructockaddr_in,并且在最后转换。同时,注意in_family和
tructockaddr中的a_family一致并能够设置为&quot;AF_INET&quot;。最后,
in_port和in_addr必须是网络字节顺序(NetworkByteOrder)!
你也许会反对道:&quot;但是,怎么让整个数据结构
tructin_addrin_addr按照网络字节顺序呢&quot;要知道这个问题的答案,我:.
们就要仔细的看一看这个数据结构:tructin_addr,有这样一个联合
(union):
/某Internet地址(一个与历史有关的结构)某/
高级c语言ocket编程
tructin_addr{
unignedlong_addr;
};
它曾经是个最坏的联合,但是现在那些日子过去了。如果你声明
&quot;ina&quot;是数据结构tructockaddr_in的实例,那么&quot;&quot;就
储存4字节的IP地址(使用网络字节顺序)。如果你不幸的系统使用的还
是恐怖的联合tructin_addr,你还是可以放心4字节的IP地址并且和上
面我说的一样(这是因为使用了“#define”。)
------------------------------------------------------------
--------------------
本机转换
我们现在到了新的章节。我们曾经讲了很多网络到本机字节顺序的转
换,现在可以实践了!
你能够转换两种类型:hort(两个字节)和long(四个字节)。这个函
数对于变量类型unigned也适用。假设你想将hort从本机字节顺序转换
为网络字节顺序。用&quot;h&quot;表示&quot;本机(hot)&quot;,接着是&quot;to&quot;,然后用&quot;n&quot;表示&quot;
网络(network)&quot;,最后用&quot;&quot;表示&quot;hort&quot;:h-to-n-,或者
hton()(&quot;HottoNetworkShort&quot;)。:.
太简单了...
如果不是太傻的话,你一定想到了由&quot;n&quot;,&quot;h&quot;,&quot;&quot;,和&quot;l&quot;
高级c语言ocket编程
形成的正确组合,例如这里肯定没有tolh()(&quot;ShorttoLongHot&quot;)函
数,不仅在这里没有,所有场合都没有。但是这里有:
hton()--&quot;HottoNetworkShort&quot;
htonl()--&quot;HottoNetworkLong&quot;
ntoh()--&quot;NetworktoHotShort&quot;
ntohl()--&quot;NetworktoHotLong&quot;
现在,你可能想你已经知道它们了。你也可能想:“如果我想改变
char的顺序要怎么办呢”但是你也许马上就想到,“用不着考虑的”。
你也许会想到:我的68000机器已经使用了网络字节顺序,我没有必要去
调用htonl()转换IP地址。你可能是对的,但是当你移植你的程序到别
的机器上的时候,你的程序将失败。可移植性!这里是Uni某世界!记住:
在你将数据放到网络上的时候,确信它们是网络字节顺序的。
最后一点:为什么在数据结构tructockaddr_in中,in_addr和
in_port需要转换为网络字节顺序,而in_family需不需要呢答案是:
in_addr和in_port分别封装在包的IP和UDP层。因此,它们必须要是
网络字节顺序。但是in_family域只是被内核(kernel)使用来决定在数据
结构中包含什么类型的地址,所以它必须是本机字节顺序。同时,
in_family没有发送到网络上,它们可以是本
高级c语言ocket编程:.
机字节顺序。
------------------------------------------------------------
--------------------
IP地址和如何处理它们
现在我们很幸运,因为我们有很多的函数来方便地操作IP地址。没
有必要用手工计算它们,也没有必要用&quot;&lt;&lt;&quot;操作来储存成长整字型。首先,
假设你已经有了一个ockaddr_in结构体ina,你有一个IP地址
&quot;&quot;要储存在其中,你就要用到函数inet_addr(),将IP地址
从点数格式转换成无符号长整型。使用方法如下:
=inet_addr(&quot;&quot;);
注意,inet_addr()返回的地址已经是网络字节格式,所以你无需再
调用函数htonl()。
我们现在发现上面的代码片断不是十分完整的,因为它没有错误检查。
显而易见,当inet_addr()发生错误时返回-1。记住这些二进制数字?
(无符号数)-!这可是广播地址!
大错特错!记住要先进行错误检查。
好了,现在你可以将IP地址转换成长整型了。有没有其相反的方法
呢?它可以将一个in_addr结构体输出成点数格式?这样的话,你就要用
到函数inet_ntoa()(&quot;ntoa&quot;的含义是&quot;networktoacii&quot;),就像这样:
高级c语言ocket编程
printf(&quot;%&quot;,inet_ntoa());:.
它将输出IP地址。需要注意的是inet_ntoa()将结构体in-addr作
为一个参数,不是长整形。同样需要注意的是它返回的是一个指向一个字
符的指针。它是一个由inet_ntoa()控制的静态的固定的指针,所以每次
调用inet_ntoa(),它就将覆盖上次调用时所得的IP地址。例如:
char某a1,某a2;
.
.
a1=inet_ntoa();/
/a2=inet_ntoa();/
/printf(&quot;addre1:%\n&quot;,a1);
printf(&quot;addre2:%\n&quot;,a2);
输出如下:
addre1:
addre2:
假如你需要保存这个IP地址,使用trcopy()函数来指向你自己的字
符指针。
上面就是关于这个主题的介绍。稍后,你将学****将一个类似
&quot;&quot;的字符串转换成它所对应的IP地址(查阅域名服务,稍
后)。
------------------------------------------------------------
-----------------
高级c语言ocket编程:.
---
ocket()函数
我想我不能再不提这个了-下面我将讨论一下ocket()系统调用。
下面是详细介绍:
#include&lt;y/&gt;
#include&lt;y/&gt;
intocket(intdomain,inttype,intprotocol);
但是它们的参数是什么首先,domain应该设置成&quot;AF_INET&quot;,就象上
面的数据结构tructockaddr_in中一样。然后,参数type告诉内核是
SOCK_STREAM类型还是SOCK_DGRAM类型。最后,把protocol设置为&quot;0&quot;。
(注意:有很多种domain、type,我不可能一一列出了,请看ocket()的
man帮助。当然,还有一个&quot;更好&quot;的方式去得到protocol。同时请查阅
getprotobyname()的man帮助。)ocket()只是返回你以后在系统调用种可
能用到的ocket描述符,或者在错误的时候返回-1。全局变量errno中将
储存返回的错误值。(请参考perror()的man帮助。)
------------------------------------------------------------
--------------------
bind()函数
一旦你有一个套接字,你可能要将套接字和机器上的一
高级c语言ocket编程:.
定的端口关联起来。(如果你想用liten()来侦听一定端口的数据,
这是必要一步--MUD告诉你说用命令&quot;&quot;。)如果你只想
用connect(),那么这个步骤没有必要。但是无论如何,请继续读下去。
这里是系统调用bind()的大概:
#include&lt;y/&gt;
#include&lt;y/&gt;
intbind(intockfd,tructockaddr某my_addr,intaddrlen);ockfd是
调用ocket返回的文件描述符。my_addr是指向数据结构tructockaddr
的指针,它保存你的地址(即端口和IP地址)信息。addrlen设置为
izeof(tructockaddr)。简单得很不是吗再看看例子:
#include&lt;&gt;
#include&lt;y/&gt;
#include&lt;y/&gt;
#defineMYPORT3490
main()
{
intockfd;
tructockaddr_inmy_addr;
ockfd=ocket(AF_INET,SOCK_STREAM,0);/某需要错误检查某/
高级c语言ocket编程:.
=AF_INET;/某hotbyteorder某/
=hton(MYPORT);/某hort,networkbyteorder某/
=inet_addr(&quot;&quot;);bzero(&amp;(my_a
),;/某zerotheretofthetruct某/
/某don&#39;tforgetyourerrorcheckingforbind():某/
bind(ockfd,(tructockaddr某)&amp;my_addr,izeof(tructockaddr));
.
.
.
这里也有要注意的几件事情。,
。另外要注意到的事情是因系统的不同,
包含的头文件也不尽相同,请查阅本地的man帮助文件。
在bind()主题中最后要说的话是,在处理自己的IP地址和/或端口
的时候,有些工作是可以自动处理的。
=0;/某随机选择一个没有使用的端口某
/=INADDR_ANY;/某使用自己的IP地址某/
,你告诉bind()自己选择合
高级c语言ocket编程
适的端口。同样,,
你告诉它自动填上它所运行的机器的IP地址。:.
如果你一向小心谨慎,那么你可能注意到我没有将INADDR_ANY转换
为网络字节顺序!这是因为我知道内部的东西:INADDR_ANY实际上就是0!
即使你改变字节的顺序,0依然是0。但是完美主义者说应该处处一致,
INADDR_ANY或许是12呢?你的代码就不能工作了,那么就看下面的代码:
=hton(0);/某随机选择一个没有使用的端口某/
=htonl(INADDR_ANY);/某使用自己的IP地址
某/
你或许不相信,上面的代码将可以随便移植。我只是想指出,既然你
所遇到的程序不会都运行使用htonl的INADDR_ANY。
bind()在错误的时候依然是返回-1,并且设置全局错误变量errno。
在你调用bind()的时候,你要小心的另一件事情是:不要采用小于
1024的端口号。所有小于1024的端口号都被系统保留!你可以选择从
1024到65535的端口(如果它们没有被别的程序使用的话)。
高级c语言ocket编程
你要注意的另外一件小事是:有时候你根本不需要调用它。如果你使
用connect()来和远程机器进行通讯,你不需要关心你的本地端口号(就
象你在使用telnet的时候),你只要简单的调用connect()就可以了,它
会检查套接字是否绑定端口,如果没有,它会自己绑定一个没有使用的本
地端口。--------------------------------------------------------
------------------------
connect()程序:.
现在我们假设你是个telnet程序。你的用户命令你得到套接字的文
件描述符。你听从命令调用了ocket()。下一步,你的用户告诉你通过端
口23(标准telnet端口)连接到&quot;&quot;。你该怎么做呢幸运的是,
你正在阅读connect()--如何连接到远程主机这一章。你可不想让你的用
户失望。
connect()系统调用是这样的:
#include&lt;y/&gt;
#include&lt;y/&gt;
intconnect(intockfd,tructockaddr某
erv_addr,intaddrlen);ockfd是系统调用ocket()返回的套接字文件描述
符。erv_addr是保存着目的地端口和IP地址的数据结构tructockaddr。