先来说一下这三个的意思:
- URI(Uniform Resource Identifier ):统一资源标识符,就是在某一规则下能把一个资源独一无二地标识出来。
- URL(Uniform Resource Locator):统一资源定位符。
- URN(Uniform Resource Name):统一资源名称。
以下内容转自HTTP 协议中 URI 和 URL 有什么区别?
拿人做例子,假设这个世界上所有人的名字都不能重复,那么名字就是URI的一个实例,通过名字这个字符串就可以标识出唯一的一个人。
现实当中名字当然是会重复的,所以身份证号才是URI,通过身份证号能让我们能且仅能确定一个人。
那统一资源定位符URL是什么呢?也拿人做例子然后跟HTTP的URL做类比,就可以有:
动物住址协议://地球/中国/浙江省/杭州市/西湖区/某大学/14号宿舍楼/525号寝/[张三.人]
可以看到,这个字符串同样标识出了唯一的一个人,起到了URI的作用,所以URL是URI的子集。URL是以描述人的位置来唯一确定一个人的。
在上文我们用身份证号也可以唯一确定一个人。对于这个在杭州的张三,我们也可以用:
身份证号:123456789
来标识他。
所以不论是用定位的方式还是用编号的方式,我们都可以唯一确定一个人,都是URl的一种实现,而URL就是用定位的方式实现的URI。
回到Web上,假设所有的Html文档都有唯一的编号,记作html:xxxxx,xxxxx是一串数字,即Html文档的身份证号码,这个能唯一标识一个Html文档,那么这个号码就是一个URI。
而URL则通过描述是哪个主机上哪个路径上的文件来唯一确定一个资源,也就是定位的方式来实现的URI。
对于现在网址我更倾向于叫它URL,毕竟它提供了资源的位置信息,如果有一天网址通过号码来标识变成了http://741236985.html,那感觉叫成URI更为合适,不过这样子的话还得想办法找到这个资源咯…
- 疑问:没明白为什么是包含与被包含的关系,按照你的解释,不应该是并列关系么?url通过地址确定,uri通过号码确定。二者不存在包含关系啊。
- 答:URI 不一定非得是通过号码确定的。URI 是在「某一规则」下标识出一个资源的字符串,通过地址或者通过号码都是可行的规则,其中通过地址规则实现的 URI 可以被称作 URL ,URL 是 URI 的一种实现,所以URI 作为更宽泛的定义是包含了 URL 的,就像三角形包含等边三角形一样。
如果你还是不太理解,请看以下内容。
以下内容转自 [译]URL和URI的区别 - 华科小涛 - 博客园
一直存在很多技术上的争论,其中最为妙的恐怕就是web地址应该叫什么的问题。通常情况就是这样:有人把地址栏的内容叫“URL”,这时候有些人就来劲了:“不!其实那是URI...”。
对于这种纠正的反应呢,通常也有这么几种情况,心眼小的就寻思这人赶紧走吧,淡定点的就耸耸肩表示同意,火气大的就拔刀相向了好不?
那这篇文章呢,就对这个只是提供一个简单的总结,毕竟互黑也要黑到点子上是吧。
URI,URL,URN
从上面的那幅图可以看出来,一共有三个不同的概念URI,URL,URN。在讨论这样的问题时,最好的方法就是回到原点啊,这里我们在RFC 3986: Uniform Resource Identifier (URI): Generic Syntax里面收集了点资料:
“A Uniform Resource Identifier (URI) 是一个紧凑的字符串用来标示抽象或物理资源。”
“A URI 可以进一步被分为定位符、名字或两者都是. 术语“Uniform Resource Locator” (URL) 是URI的子集, 除了确定一个资源,还提供一种定位该资源的主要访问机制(如其网络“位置”)。“
那我们无所不知的维基百科把这段消化的很好,并描述的更加形象了:
“URI可以分为URL,URN或同时具备locators 和names特性的一个东西。URN作用就好像一个人的名字,URL就像一个人的地址。换句话说:URN确定了东西的身份,URL提供了找到它的方式。”
通过这些描述我们可以得到一些结论:
- 首先,URL是URI的一种(通过那个图就看的出来吧)。所以有人跟你说URL不是URI,他就错了呗。但也不是所有的URI都是URL哦,就好像蝴蝶都会飞,但会飞的可不都是蝴蝶啊,你让苍蝇怎么想!
- 让URI能成为URL的当然就是那个“访问机制”,“网络位置”。e.g.
http://
or ftp://
.。 - URN是唯一标识的一部分,就是一个特殊的名字。
下面就来看看例子吧,当来也是来自权威的RFC:
ftp://ftp.is.co.za/rfc/rfc1808.txt
(also a URL because of the protocol)http://www.ietf.org/rfc/rfc2396.txt
(also a URL because of the protocol)ldap://[2001:db8::7]/c=GB?objectClass?one
(also a URL because of the protocol)mailto:John.Doe@example.com
(also a URL because of the protocol)news:comp.infosystems.www.servers.unix
(also a URL because of the protocol)tel:+1-816-555-1212
telnet://192.0.2.16:80/
(also a URL because of the protocol)urn:oasis:names:specification:docbook:dtd:xml:4.1.2
这些全都是URI, 其中有些是URL。哪些? 就是那些提供了访问机制的。
总结
下面到了回答问题的时候了:
当我们替代web地址的时候,URI和URL那个更准确?
基于我读的很多的文章,包括RFC,我想说URI更准确。
别急,我有我的理由:
我们经常使用的URI不是严格技术意义上的URL。例如:你需要的文件在files.hp.com
. 这是URI,但不是URL--系统可能会对很多协议和端口都做出正确的反应。
你去http://files.hp.com
和ftp://files.hp.com
.可能得到完全不同的内容。这种情况可能更加普遍,想想不同谷歌域名上的不同服务啊。
所以,用URI吧,这样你通常技术上是正确的,URL可不一定。最后“URL”这个术语正在被弃用,所以明智吧少年!
结语
If you don’t mind being “that guy”, URI is probably the more accurate term to use. But if you are in the linguist / “use what’s understood” camp, feel free to go with URL.