函数重载的重要性不言而明

 时间:2013-12-26  贡献者:Maksim_杨哥

导读:函数重载的重要不言而明.doc,函数重载的重要性不言而明,但是你知道 C++中函数重载是如何实现的呢(虽然本文谈的是 C++中函数重 载的实现,但我想其它语言也是类似的)?这个可以分解为下面两个问题 1

函数重载的重要不言而明.doc
函数重载的重要不言而明.doc

函数重载的重要性不言而明,但是你知道 C++中函数重载是如何实现的呢(虽然本文谈的是 C++中函数重 载的实现,但我想其它语言也是类似的)?这个可以分解为下面两个问题 1、声明/定义重载函数时,是如何解决命名冲突的?(抛开函数重载不谈,using 就是一种解决命 名冲突的方法,解决命名冲突还有很多其它的方法,这里就不论述了) 2、当我们调用一个重载的函数时,又是如何去解析的?(即怎么知道调用的是哪个函数呢)这两个问题是任何支持函数重载的语言都必须要解决的问题!带着这两个问题,我们开始本文的探讨。

本 文的主要内容如下:1、例子引入(现象)o o    o o o o o 什么是函数重载(what)? 为什么需要函数重载(why)?2、编译器如何解决命名冲突的? 函数重载为什么不考虑返回值类型3、重载函数的调用匹配 模凌两可的情况4、编译器是如何解析重载函数调用的? 根据函数名确定候选函数集 确定可用函数 确定最佳匹配函数5、总结 1、例子引入(现象) 1.1、什么是函数重载(what)?函数重载是指在同一作用域内,可以有一组具有相同函数名,不同参数列表的函数,这组函数被称为重载 函数。

重载函数通常用来命名一组功能相似的函数,这样做减少了函数名的数量,避免了名字空间的污染, 对于程序的可读性有很大的好处。

When two or more different declarations are specified for a single name in the same scope, that name is said tooverloaded. By extension, two declarations in the same scope that declare the same name but with different types are calledoverloaded declarations. Only function declarations can be overloaded; object and type declarations cannot be overloaded. ——摘自《ANSI C++ Standard. P290》 看下面的一个例子,来体会一下:实现一个打印函数,既可以打印 int 型、也可以打印字符串型。

在 C++ 中,我们可以这样做:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7. 8. 9.#include using namespace std;void print(int i) { cout<<"print a integer :"<

10. { 11. 12. } 13. 14. int main() 15. { 16. 17. 18. 19. } print(12); print("hello world!"); return 0; cout<<"print a string :"<

上面 print(12)会去 调用 print(int),print("hello world")会去调用 print(string),如下面的结果:(先用 g++ test.c 编译,然后执 行)1.2、为什么需要函数重载(why)?试想如果没有函数重载机制,如在 C 中,你必须要这样去做:为这个 print 函数取不同的名字, 如 print_int、print_string。

这里还只是两个的情况,如果是很多个的话,就需要为实现同一个功 能的函数取很多个名字,如加入打印 long 型、char*、各种类型的数组等等。

这样做很不友好! 类的构造函数跟类名相同,也就是说:构造函数都同名。

如果没有函数重载机制,要想实例化不 同的对象,那是相当的麻烦! 操作符重载,本质上就是函数重载,它大大丰富了已有操作符的含义,方便使用,如+可用于连接 字符串等!通过上面的介绍我们对函数重载,应该唤醒了我们对函数重载的大概记忆。

下面我们就来分析,C++是如 何实现函数重载机制的。

2、编译器如何解决命名冲突的?为了了解编译器是如何处理这些重载函数的,我们反编译下上面我们生成的执行文件,看下汇编代码(全 文都是在 Linux 下面做的实验,Windows 类似,你也可以参考《一道简单的题目引发的思考》一文,那里 既用到 Linux 下面的反汇编和 Windows 下面的反汇编,并注明了 Linux 和 Windows 汇编语言的区别)。

我们执行命令 objdump -d a.out >log.txt 反汇编并将结果重定向到 log.txt 文件中,然后分析 log.txt 文件。

发现函数 void print(int i) 编译之后为:(注意它的函数签名变为——_Z5printi)

发现函数 void print(string str) 编译之后为:(注意它的函数签名变为——_Z5printSs)我们可以发现编译之后,重载函数的名字变了不再都是 print!这样不存在命名冲突的问题了,但又有新的 问题了——变名机制是怎样的,即如何将一个重载函数的签名映射到一个新的标识?我的第一反应是:函 数名+参数列表,因为函数重载取决于参数的类型、个数,而跟返回类型无关。

但看下面的映射关系: void print(int i) void print(string str) --> --> _Z5printi _Z5printSs进一步猜想,前面的 Z5 表示返回值类型,print 函数名,i 表示整型 int,Ss 表示字符串 string,即映射为 返回类型+函数名+参数列表。

最后在 main 函数中就是通过_Z5printi、_Z5printSs 来调用对应的函数的:

80489bc: …………… 80489f0:e8 73 ff ff ffcall8048934 <_Z5printi>e8 7a ff ff ffcall804896f <_Z5printSs>我们再写几个重载函数来验证一下猜想,如: void print(long l) void print(char str) --> --> _Z5printl _Z5printc可以发现大概是 int->i,long->l,char->c,string->Ss….基本上都是用首字母代表,现在我们来现在一个 函数的返回值类型是否真的对函数变名有影响,如:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7. 8. 9.#include using namespace std;int max(int a,int b) { return a>=b?a:b; }double max(double a,double b)10. { 11. 12. } 13. int main() 14. { 15. 16. 17. 18. } cout<<"max int is: "<=b?a:b;int max(int a,int b) 映射为_Z3maxii、double max(double a,double b) 映射为_Z3maxdd,这证实了我的 猜想,Z 后面的数字代码各种返回类型。

更加详细的对应关系,如那个数字对应那个返回类型,哪个字符 代表哪重参数类型,就不去具体研究了,因为这个东西跟编译器有关,上面的研究都是基于 g++编译器, 如果用的是 vs 编译器的话,对应关系跟这个肯定不一样。

但是规则是一样的:“返回类型+函数名+参数列 表”。

既然返回类型也考虑到映射机制中,这样不同的返回类型映射之后的函数名肯定不一样了,但为什么不将 函数返回类型考虑到函数重载中呢?——这是为了保持解析操作符或函数调用时,独立于上下文(不依赖 于上下文),看下面的例子[cpp] view plaincopy1. 2. 3. 4.float sqrt(float); double sqrt(double);void f(double da, float fla)

5. 6. 7. 8. 9. 10. 11.{ float fl=sqrt(da);//调用 sqrt(double) double d=sqrt(da);//调用 sqrt(double)fl=sqrt(fla);//调用 sqrt(float) d=sqrt(fla);//调用 sqrt(float) }如果返回类型考虑到函数重载中,这样将不可能再独立于上下文决定调用哪个函数。

至此似乎已经完全分析清楚了,但我们还漏了函数重载的重要限定——作用域。

上面我们介绍的函数重载 都是全局函数,下面我们来看一下一个类中的函数重载,用类的对象调用 print 函数,并根据实参调用不同 的函数:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.#include using namespace std;class test{ public: void print(int i) { cout<<"int"< --> _ZN4test5printEi _ZN4test5printEc注意前面的 N4test,我们可以很容易猜到应该表示作用域,N4 可能为命名空间、test 类名等等。

这说明最 准确的映射机制为:作用域+返回类型+函数名+参数列表3、重载函数的调用匹配

现在已经解决了重载函数命名冲突的问题, 在定义完重载函数之后, 用函数名调用的时候是如何去解析的? 为了估计哪个重载函数最适合,需要依次按照下列规则来判断:    精确匹配:参数匹配而不做转换,或者只是做微不足道的转换,如数组名到指针、函数名到指向 函数的指针、T 到 const T; 提升匹配:即整数提升(如 bool 到 int、char 到 int、short 到 int),float 到 double 使用标准转换匹配:如 int 到 double、double 到 int、double 到 long double、Derived*到 Base*、 T*到 void*、int 到 unsigned int; 使用用户自定义匹配; 使用省略号匹配:类似 printf 中省略号参数如果在最高层有多个匹配函数找到,调用将被拒绝(因为有歧义、模凌两可)。

看下面的例子:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.void print(int); void print(const char*); void print(double); void print(long); void print(char);void h(char c,int i,short s, float f) { print(c);//精确匹配,调用 print(char) print(i);//精确匹配,调用 print(int) print(s);//整数提升,调用 print(int) print(f);//float 到 double 的提升,调用 print(double)print('a');//精确匹配,调用 print(char) print(49);//精确匹配,调用 print(int) print(0);//精确匹配,调用 print(int) print("a");//精确匹配,调用 print(const char*)18. }定义太少或太多的重载函数,都有可能导致模凌两可,看下面的一个例子:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7.void f1(char); void f1(long);void f2(char*); void f2(int*);void k(int i)

8. 9. 10.{ f1(i);//调用 f1(char)? f1(long)? f2(0);//调用 f2(char*)?f2(int*)?11. }这时侯编译器就会报错, 将错误抛给用户自己来处理: 通过显示类型转换来调用等等 (如 f2(static_cast(0),当然这样做很丑,而且你想调用别的方法时有用做转换)。

上面的例子只是一个参数的情况,下面 我们再来看一个两个参数的情况:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7.int pow(int ,int); double pow(double,double);void g() { double d=pow(2.0,2)//调用 pow(int(2.0),2)? pow(2.0,double(2))? }4、编译器是如何解析重载函数调用的? 编译器实现调用重载函数解析机制的时候,肯定是首先找出同名的一些候选函数,然后从候选函数中找出 最符合的,如果找不到就报错。

下面介绍一种重载函数解析的方法:编译器在对重载函数调用进行处理时, 由语法分析、C++文法、符号表、抽象语法树交互处理,交互图大致如下:这个四个解析步骤所做的事情大致如下:

   由匹配文法中的函数调用,获取函数名; 获得函数各参数表达式类型; 语法分析器查找重载函数,符号表内部经过重载解析返回最佳的函数 语法分析器创建抽象语法树,将符号表中存储的最佳函数绑定到抽象语法树上下面我们重点解释一下重载解析,重载解析要满足前面《3、重载函数的调用匹配》中介绍的匹配顺序和规 则。

重载函数解析大致可以分为三步:  根据函数名确定候选函数集 从候选函数集中选择可用函数集合 从可用函数集中确定最佳函数,或由于模凌两可返回错误4.1、根据函数名确定候选函数集根据函数在同一作用域内所有同名的函数,并且要求是可见的(像 private、protected、public、friend 之 类)。

“同一作用域”也是在函数重载的定义中的一个限定,如果不在一个作用域,不能算是函数重载,如 下面的代码:[cpp] view plaincopy1. 2. 3. 4. 5. 6. 7.void f(int);void g() { void f(double); f(1); //这里调用的是 f(double),而不是 f(int) }即内层作用域的函数会隐藏外层的同名函数!同样的派生类的成员函数会隐藏基类的同名函数。

这很好理 解,变量的访问也是如此,如一个函数体内要访问全局的同名变量要用“::”限定。

为了查找候选函数集,一般采用深度优选搜索算法: step1:从函数调用点开始查找,逐层作用域向外查找可见的候选函数 step2: 如果上一步收集的不在用户自定义命名空间中, 则用到了 using 机制引入的命名空间中的候选函数, 否则结束 在收集候选函数时,如果调用函数的实参类型为非结构体类型,候选函数仅包含调用点可见的函数;如果 调用函数的实参类型包括类类型对象、类类型指针、类类型引用或指向类成员的指针,候选函数为下面集 合的并:  (1)在调用点上可见的函数; (2)在定义该类类型的名字空间或定义该类的基类的名字空间中声明的函数; (3)该类或其基类的友元函数;下面我们来看一个例子更直观:[cpp] view plaincopy

1. 2. 3. 4. 5. 6. 7. 8. 9.void f(); void f(int); void f(double, double = 314); names pace N { void f(char3 ,char3); } classA{ public: operat or double() { }10. }; 11. int main ( ) 12. { 13. 14. 15. 16. 17. } using names pace N; //using 指示符 A a; f(a); return 0;根据上述方法,由于实参是类类型的对象,候选函数的收集分为 3 步: (1)从函数调用所在的 main 函数作用域内开始查找函数 f 的声明, 结果未找到。

到 main 函数 作用域的外层作用域查找,此时在全局作用域找到 3 个函数 f 的声明,将它们放入候选集合; (2)到 using 指示符所指向的命名空间 N 中收集 f ( char3 , char3 ) ; (3)考虑 2 类集合。

其一为定义该类类型的名字空间或定义该类的基类的名字空间中声明的函 数;其二为该类或其基类的友元函数。

本例中这 2 类集合为空。

最终候选集合为上述所列的 4 个函数 f。

4.2、确定可用函数可用的函数是指:函数参数个数匹配并且每一个参数都有隐式转换序列。

  (1)如果实参有 m 个参数,所有候选参数中,有且只有 m 个参数; (2)所有候选参数中,参数个数不足 m 个,当前仅当参数列表中有省略号; (3)所有候选参数中,参数个数超过 m 个,当前仅当第 m + 1 个参数以后都有缺省值。

如果可用 集合为空,函数调用会失败。

这些规则在前面的《3、重载函数的调用匹配》中就有所体现了。

4.3、确定最佳匹配函数确定可用函数之后,对可用函数集中的每一个函数,如果调用函数的实参要调用它计算优先级,最后选出 优先级最高的。

如对《3、重载函数的调用匹配》中介绍的匹配规则中按顺序分配权重,然后计算总的优先 级,最后选出最优的函数。

5、总结

本文介绍了什么是函数重载、为什么需要函数重载、编译器如何解决函数重名问题、编译器如何解析重载 函数的调用。

通过本文,我想大家对 C++中的重载应该算是比较清楚了。

说明:在介绍函数名映射机制是 基于 g++编译器,不同的编译器映射有些差别;编译器解析重载函数的调用,也只是所有编译器中的一种。

如果你对某个编译器感兴趣,请自己深入去研究。

最后我抛给大家两个问题:1、在 C++中加号+,即可用于两个 int 型之间的相加、也可以用于浮点数数之间的相加、字符串 之间的连接,那+算不算是操作符重载呢?换个场景 C 语言中加号+,即可用于两个 int 型之间的 相加、也可以用于浮点数数之间的相加,那算不算操作符重载呢?2、模板(template)的重载时怎么样的?模板函数和普通函数构成的重载,调用时又是如何匹配 的呢?附录:一种 C++函数重载机制这个机制是由张素琴等人提出并实现的,他们写了一个 C++的编译系统 COC++(开发在国产机上,UNIX 操作系统环境下具有中国自己版权的 C、C++和 FORTRAN 语言编译系统,这些编译系统分别满足了 ISOC90、AT&T 的 C++85 和 ISOFORTRAN90 标准)。

COC++中的函数重载处理过程主要包括两个子过 程:1、在函数声明时的处理过程中,编译系统建立函数声明原型链表,按照换名规则进行换名并在函 数声明原型链表中记录函数换名后的名字(换名规则跟本文上面描述的差不多,只是那个 int-》为 哪个字符、char-》为哪个字符等等类似的差异)

图附 1、 过程 1-建立函数链表 (说明, 函数名的编码格式为: <原函数名>_<作用域换名><函数参数表编码>, 这跟 g++中的有点不一样)2、在函数调用语句翻译过程中,访问符号表,查找相应函数声明原型链表,按照类型匹配原则, 查找最优匹配函数节点,并输出换名后的名字下面给出两个子过程的算法建立函数声明原型链表 算法流程如图附 1,函数调用语句翻译算法流程如图附 2。

图附 2、过程 2- 重载函数调用,查找链表 附-模板函数和普通函数构成的重载,调用时又是如何匹配的呢? 下面是 C++创始人 Bjarne Stroustrup 的回答: 1)Find the set of function template specializations that will take part in overload resolution. 2)if two template functions can be called and one is more specified than the other, consider only the most specialized template function in the following steps. 3)Do overload resolution for this set of functions, plus any ordinary functions as for ordinary functions. 4)If a function and a specialization are equally good matches, the function is perferred. 5)If no match is found, the call is an error.