运算方法、装置、芯片、电子装置及存储介质转让专利
申请号 : CN202111022511.X
文献号 : CN113721884B
文献日 : 2022-04-19
发明人 : 田超 , 贾磊 , 王海峰
申请人 : 北京百度网讯科技有限公司
摘要 :
权利要求 :
1.一种运算方法,包括:
获取目标浮点数相应的整数部分和小数部分;
对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;
通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;
基于所述查表值,利用硬件执行泰勒级数计算来确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及基于以所述整数部分为指数进行以所述目标值为底的指数运算所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
2.根据权利要求1所述的方法,其中,获取目标浮点数相应的整数部分和小数部分包括:
计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;以及
将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算,其中,所述转换指数为将所述目标浮点数和所述第二预设值输入第一乘法器而所述第一乘法器来计算得到的,其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
3.根据权利要求2所述的方法,其中,所述目标值为2。
4.根据权利要求2所述的方法,其中,所述转换指数和所述高位子部分的查表值均用定点数表示,并且所述转换指数的小数位的数量和所述查表值的小数位的数量相同。
5.根据权利要求1所述的方法,其中,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,
并且其中,基于所述查表值,利用硬件执行泰勒级数计算来确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果包括:利用第二乘法器计算所述低位子部分和以e为底对所述目标值进行指数运算的结果之间的第一乘积值;
基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
6.根据权利要求2‑5中任一项所述的方法,还包括:利用第一移位器将目标浮点数转换为目标定点数,其中,将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算包括:
将以所述目标定点数为指数的预设指数运算转换为对相应的转换指数的以目标值为底的指数运算。
7.根据权利要求6所述的方法,其中,第二预设值用定点数表示,并且所述目标定点数的小数位的数量和所述第二预设值的小数位的数量相同。
8.根据权利要求6所述的方法,其中,第一预设值为e,其中,在所述目标值为2的情况下,所述目标浮点数相应的转换指数为通过以下步骤获得:
以所述目标定点数和1/ln2作为输入,利用第一乘法器获得所述转换指数。
9.根据权利要求6所述的方法,其中,当所述转换指数用定点数表示时,所述转换指数的小数位的数量和所述目标定点数的小数位的数量相同。
10.根据权利要求5所述的方法,其中,在所述目标值为2的情况下,基于以所述整数部分为指数进行以2为底的指数运算所得到的结果,以及以所述小数部分为指数进行以2为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果包括:
利用与门将以所述小数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;
利用第二移位器将以二进制表示的所述整数部分左移预设位,得到第二中间值,其中,所述预设位与转换指数的小数位的数量相同;以及对所述第一中间值和第二中间值进行连接,获得以所述目标浮点数为指数进行指数运算所得到的结果。
11.根据权利要求1所述的方法,所述目标浮点数为单精度浮点数。
12.根据权利要求1所述的方法,其中,所述目标浮点数为神经网络中分类器的输入。
13.一种运算装置,包括:
获取单元,被配置用于获取目标浮点数相应的整数部分和小数部分;
划分单元,被配置用于对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;
查表单元,被配置用于通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;
第一确定单元,被配置用于基于所述查表值,利用硬件执行泰勒级数计算来确定以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及第二确定单元,被配置用于基于以所述整数部分为指数进行以所述目标值为底的指数所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
14.根据权利要求13所述的装置,其中,所述获取单元包括:第一计算单元,被配置用于计算用于将以第一预设值为底的预设指数运算转换为以所述目标值为底的指数运算的第二预设值;
第一乘法器,被配置用于接收所输入的所述目标浮点数和所述第二预设值,并输出所述目标浮点数相应的转换指数;以及转换单元,被配置用于将以目标浮点数为指数的预设指数运算转换为对相应的所述转换指数的以所述目标值为底的指数运算,其中,所述目标浮点数相应的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指数的小数部分。
15.根据权利要求14所述的装置,还包括:第一移位器,被配置用于接收所输入的目标浮点数,并输出目标定点数,其中,所述转换单元被配置用于将以所述目标定点数为指数的预设指数运算转换为对相应的转换指数的以所述目标值为底的指数运算。
16.根据权利要求13所述的装置,其中,二进制表示的所述小数部分被划分为所述高位子部分和低位子部分两部分,
并且其中,所述第一确定单元包括:第二乘法器,被配置用于接收所输入的所述低位子部分和以e为底对所述目标值进行指数运算的结果,并输出第一乘积值;以及第二计算单元,被配置用于基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
17.根据权利要求16所述的装置,其中,所述第二计算单元包括多个子乘法器和多个子加法器;
其中一个子乘法器被配置用于计算所述第一乘积值的平方;
另一个子乘法器被配置用于计算所述查表值和所述第一乘积值相应的乘积,得到第二乘积值;
另一个乘法器被配置用于计算所述第一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;
所述多个子加法器被配置用于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
18.根据权利要求13‑16中任一项所述的装置,其中,转换指数和多个子部分各自的查表值均用定点数表示,并且所述转换指数的小数位的数量和各查表值的小数位的数量相同,
其中,在所述目标值为2的情况下,所述第二确定单元包括:与门,被配置用于将以所述小数部分为指数进行以2为底的指数运算所得到的结果与
0X7FFFFF进行与操作,得到第一中间值;
第二移位器,被配置用于将以二进制表示的所述整数部分左移预设位,得到第二中间值,其中,所述预设位与所述转换指数的小数位的数量相同;以及连接单元,被配置用于对所述第一中间值和第二中间值进行连接,获得以所述目标浮点数为指数进行指数运算所得到的结果。
19.一种运算方法,包括:
B
将目标浮点数表示为A*2,其中,A为尾数,B为指数;
对于所述目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;
通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;
基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及B
以对2 进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果作为输入,利用加法器获得对所述目标浮点数进行预设对数运算所得到的结果。
20.根据权利要求19所述的方法,其中,基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果包括:通过查表获取以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值;以及基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
21.根据权利要求19所述的方法,其中,通过查表获取以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值包括:通过查表获得预设对数函数的一阶导数对应所述目标子部分的一阶导数值;
基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值。
22.根据权利要求21所述的方法,其中,基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值包括:利用乘法器计算所述一阶导数值的平方,以及基于所述一阶导数值的平方和所述预设对数函数的二阶导数的符号位,计算所述预设对数函数的二阶导数对应所述目标子部分的二阶导数值。
23.根据权利要求19‑22中任一项所述的方法,其中,所述预设数量为4‑8。
24.根据权利要求23所述的方法,其中,所述预设数量为7。
25.根据权利要求19‑22中任一项所述的方法,其中,所述查表值和对2进行预设对数运算所得到的结果均为定点数,并且两者的小数位的数量相同。
26.根据权利要求19‑22中任一项所述的方法,其中,所述目标浮点数为单精度浮点数。
27.根据权利要求19‑22中任一项所述的方法,其中,所述目标浮点数为模型波束的复数转实数层的输入。
28.一种运算装置,包括:
B
表示单元,被配置用于将目标浮点数表示为A*2,其中,A为尾数,B为指数;
划分单元,被配置用于对于目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量的目标子部分;
第一查表单元,被配置用于通过查表获得所述目标子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;
确定单元,被配置用于基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;以及
B
加法器,被配置用于接收所输入的对2进行预设对数运算所得到的结果,以及对所述尾数部分进行预设对数运算所得到的结果,并输出对所述目标浮点数进行预设对数运算所得到的结果。
29.根据权利要求28所述的装置,其中,所述确定单元包括:获取单元,被配置用于通过查表获取以所述预设值为底的预设对数函数的各阶导数各自对应所述目标子部分的导数值;以及第一计算单元,被配置用于基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
30.根据权利要求29所述的装置,其中,所述获取单元包括:第二查表单元,被配置用于通过查表获得预设对数函数的一阶导数对应所述目标子部分的一阶导数值;以及
第二计算单元,被配置用于基于所述一阶导数值,计算所述预设对数函数的所述至少一部分阶数中的其它阶导数各自对应所述目标子部分的导数值。
31.根据权利要求30所述的装置,其中,所述第二计算单元包括:乘法器,被配置用于计算所述一阶导数值的平方;
计算子单元,被配置用于基于所述一阶导数值的平方和所述预设对数函数的二阶导数的符号位,计算所述预设对数函数的二阶导数对应所述目标子部分的二阶导数值。
32.根据权利要求31所述的装置,其中,所述第一计算单元包括多个子乘法器和多个子加法器,每一子乘法器具有两个输入,每一子加法器具有两个输入;
其中一个子乘法器被配置用于计算所述目标浮点数的小数部分和所述目标子部分之间的目标差值的平方;
另一个子乘法器被配置用于计算所述一阶导数值和所述目标差值的相应的乘积,得到第一乘积值;
另一个子乘法器被配置用于计算所述二阶导数值和所述目标差值的平方相应的乘积,得到第二乘积值;
所述多个子加法器被配置用于对所述查表值、所述第一乘积值和所述第二乘积值进行求和,并且所得到的求和值为对所述尾数部分进行预设对数运算所得到的结果。
33.一种芯片,包括以下装置中的至少其中之一:权利要求13‑18中任一项所述的装置,以及权利要求28‑32中任一项所述的装置。
34.一种电子设备,包括权利要求33所述的芯片。
35.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1‑12中任一项所述的方法或权利要求19‑27中任一项所述的方法。
36.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1‑12中任一项所述的方法或权利要求19‑27中任一项所述的方法。
37.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1‑12中任一项所述的方法或权利要求19‑27中任一项所述的方法。
说明书 :
运算方法、装置、芯片、电子装置及存储介质
技术领域
背景技术
括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技
术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、
大数据处理技术、知识图谱技术等几大方向。用于实现人工智能处理的芯片往往涉及大量
的神经网络运算。随着人工智能技术的迭代,需要芯片能够具有处理复杂神经网络运算的
能力。
已经无法满足当前人工智能网络对芯片运算能力的需求。
地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
部分;通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进
行以目标值为底的指数运算所得到的结果;基于所述查表值,利用硬件确定以所述小数部
分为指数进行以所述目标值为底的指数运算所得到的结果;以及基于以所述整数部分为指
数进行以所述目标值为底的指数运算所得到的结果,以及以所述小数部分为指数进行以所
述目标值为底的指数运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数
运算所得到的结果。
部分进行划分,得到最高位的预设数量的高位子部分;查表单元,被配置用于通过查表获得
所述高位子部分的查表值,所述查表值为以所述高位子部分为指数进行以目标值为底的指
数运算所得到的结果;第一确定单元,被配置用于基于所述查表值,利用硬件确定以所述小
数部分为指数进行以所述目标值为底的指数运算所得到的结果;以及第二确定单元,被配
置用于基于以所述整数部分为指数进行以所述目标值为底的指数所得到的结果,以及以所
述小数部分为指数进行以所述目标值为底的指数运算所得到的结果,利用硬件确定以所述
目标浮点数为指数进行指数运算所得到的结果。
设数量的目标子部分;通过查表获得目标子部分的查表值,查表值为对目标子部分进行以
预设值为底的预设对数运算所得到的结果;基于查表值,确定对尾数部分进行预设对数运
B
算所得到的结果;以及以对2 进行预设对数运算所得到的结果,以及对尾数部分进行预设
对数运算所得到的结果作为输入,利用加法器获得对目标浮点数进行预设对数运算所得到
的结果。
标浮点数表示为A*2 ,其中,A为尾数,B为指数;划分单元,被配置用于对于目标浮点数,对
二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分;第一查表单元,被配置
用于通过查表获得目标子部分的查表值,查表值为对目标子部分进行以预设值为底的预设
对数运算所得到的结果;确定单元,被配置用于基于查表值,确定对尾数部分进行预设对数
B
运算所得到的结果;以及加法器,被配置用于接收所输入的对2 进行预设对数运算所得到
的结果,以及对尾数部分进行预设对数运算所得到的结果,并输出对目标浮点数进行预设
对数运算所得到的结果。
令被至少一个处理器执行,以使至少一个处理器能够执行上述对浮点数进行指数运算的方
法或上述对浮点数进行对数运算的方法。
点数进行对数运算的方法。
对数运算的方法。
升运算效率。
附图说明
求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
具体实施方式
到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了
清楚和简明,以下的描述中省略了对公知功能和结构的描述。
一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些
情况下,基于上下文的描述,它们也可以指代不同实例。
以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何
一个以及全部可能的组合方式。
效率已经无法满足当前人工智能网络对芯片运算能力的需求。
运算,获取目标浮点数的整数部分和小数部分,确定以整数部分为指数进行以目标值为底
的指数运算所得到的结果,以及基于对小数部分的分解,得到最高位的预设数量的高位子
部分,并基于高位子部分的查表值,确定以小数部分为指数进行以目标值为底的指数运算
所得到的结果,并由此得到最终的对目标浮点数进行指数运算的运算结果。
B
取目标子部分的查表值,最终通过对2 进行预设对数运算所得到的结果,以及对尾数部分
进行上述预设对数运算所得到的结果,来获得最终的对目标浮点数进行预设对数运算所得
到的结果。
在保证计算精度的情况下,有效提升运算效率。
位的预设数量的高位子部分;步骤S103、通过查表获得所述高位子部分的查表值,所述查表
值为以所述高位子部分为指数进行以目标值为底的指数运算所得到的结果;步骤S104、基
于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所
得到的结果;以及步骤S105、基于以所述整数部分为指数进行以所述目标值为底的指数运
算所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数运算所得到的
结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
表,能够有效减少所需存储的表项数量,降低芯片中的存储资源的占用,减小芯片面积。
个元素中的任意两个相邻的元素,当其中在先的一个元素处理至第二周期时,可以开始对
其中在后的一个元素的第一周期的处理,由此,能够有效地提升数据处理的效率。
算的第二预设值;以及将以目标浮点数为指数的预设指数运算转换为对相应的转换指数的
以所述目标值为底的指数运算,其中,所述转换指数为将所述目标浮点数和所述第二预设
值输入第一乘法器而由所述第一乘法器来计算得到的,其中,所述目标浮点数相应的所述
整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述转换指
数的小数部分。
值。
可以将以第一预设值P为底的预设指数运算P转换为:
于一个目标浮点数a表示为单精度浮点数的具体形式为:
第一乘法器而利用第一乘法器来计算得到的。
换指数。
指数运算e转换为对相应的转换指数1.44269×a的以2为底的指数运算,该转换具体可以
表示为:
为底的指数运算包括:将以目标定点数为指数的预设指数运算转换为对相应的转换指数的
以目标值为底的指数运算。由此,能够将基于浮点数的乘法运算转换为对定点数的乘法运
算,有效地降低了计算复杂度,减少芯片中逻辑资源的占用,缩减芯片面积,提升运算效率。
根据一些实施例,利用移位器将目标浮点数转换为目标定点数可以进一步表示为:
计算,进一步降低了计算的复杂度。
以用定点数表示,并且目标定点数的小数位的数量和第二预设值的小数位的数量相同。由
此,能够简化计算复杂度。
位后得到的定点数的小数位的数量和目标定点数ai的小数位的数量相同。由此,可以将用
于计算转换指数的浮点数计算转换为对定点数的计算,有效降低了计算的复杂度。
理的复杂度。
入和朝0方向舍入等。
运算,为了降低计算复杂度,可以基于查表的方式,确定2 的值。
查表操作。例如,在ci的小数位位数为23时,需要预先存储表项项数为2 项的指数计算结果
ci 23 ci
以包含对2 的各种可能的计算结果,即对在2 个表项中的每一项分别存储2 的一种可能
的计算结果。为了节省芯片内的存储资源,可以将小数部分ci进行划分,得到最高位的预设
数量的高位子部分。
2 =2 的情况下,可以针对ci0执行查表以确定其所对应的2 的值。其中,在ci0保留
8
ci的高8位的连续小数位处的取值的情况下,ci0所需的表项数量为2 ,极大地缩减了所需
的存储空间。
点数计算,进而简化运算复杂度。
指数进行以所述目标值为底的指数运算所得到的结果包括:利用第二乘法器计算所述低位
子部分和以e为底对所述目标值进行指数运算的结果之间的第一乘积值;基于所述查表值
和所述第一乘积值,利用泰勒级数计算以所述小数部分为指数进行以所述目标值为底的指
数运算所得到的结果。
值和所述第一乘积值相应的乘积,得到第二乘积值;另一个乘法器被配置用于计算所述第
一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;所述多个子加法器被配置用
于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求和值为以
所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
ci0
被配置用于计算2 (ci1×ln 2)(即查表值和第一乘积值相乘得到的第二乘积值;另一个
ci0 2
乘法器被配置用于计算2 (ci1×ln 2) (即第一乘积值的平方和查表值相乘得到第三乘
积值;所述多个子加法器被配置用于对基于所述查表值、所述第二乘积值和所述第三乘积
值所构成的泰勒展开项进行求和,并且所得到的求和值为以所述小数部分为指数进行以所
述目标值为底的指数运算所得到的结果。
ci bi
结果2 ,可以确定以目标浮点数为指数进行指数运算所得到的结果2 。
果,利用硬件确定以目标浮点数为指数进行指数运算所得到的结果包括:利用与门将以小
数部分为指数进行以2为底的指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中
间值;利用第二移位器将以二进制表示的整数部分左移预设位,得到第二中间值,其中,预
设位与转换指数的小数位的数量相同;以及对第一中间值和第二中间值进行连接,获得以
目标浮点数为指数进行指数运算所得到的结果。由此,能够方便地获取以单精度浮点数表
示的最终计算结果。
0X7FFFFF进行与操作,可以抹去该结果的整数部分的1,而得到要存储至尾数部分的仅包含
小数位的第一中间值。
数的指数运算处理。该神经网络可以应用于语音处理、图像处理等技术领域。
用于对二进制表示的所述小数部分进行划分,得到最高位的预设数量的高位子部分;查表
单元203,被配置用于通过查表获得所述高位子部分的查表值,所述查表值为以所述高位子
部分为指数进行以目标值为底的指数运算所得到的结果;第一确定单元204,被配置用于基
于所述查表值,利用硬件确定以所述小数部分为指数进行以所述目标值为底的指数运算所
得到的结果;以及第二确定单元205,被配置用于基于以所述整数部分为指数进行以所述目
标值为底的指数所得到的结果,以及以所述小数部分为指数进行以所述目标值为底的指数
运算所得到的结果,利用硬件确定以所述目标浮点数为指数进行指数运算所得到的结果。
法器,被配置用于接收所输入的所述目标浮点数和所述第二预设值,并输出所述目标浮点
数相应的转换指数;以及转换单元,被配置用于将以目标浮点数为指数的预设指数运算转
换为对相应的所述转换指数的以所述目标值为底的指数运算,其中,所述目标浮点数相应
的所述整数部分为所述转换指数的整数部分,所述目标浮点数相应的所述小数部分为所述
转换指数的小数部分。
换为对相应的转换指数的以目标值为底的指数运算。
述低位子部分和以e为底对所述目标值进行指数运算的结果,并输出第一乘积值;以及第二
计算单元,被配置用于基于所述查表值和所述第一乘积值,利用泰勒级数计算以所述小数
部分为指数进行以所述目标值为底的指数运算所得到的结果。
所述查表值和所述第一乘积值相应的乘积,得到第二乘积值;另一个乘法器被配置用于计
算所述第一乘积值的平方和所述查表值相应的乘积,得到第三乘积值;所述多个子加法器
被配置用于对所述查表值、所述第二乘积值和所述第三乘积值进行求和,并且所得到的求
和值为以所述小数部分为指数进行以所述目标值为底的指数运算所得到的结果。
值为2的情况下,第二确定单元包括:与门,被配置用于将以小数部分为指数进行以2为底的
指数运算所得到的结果与0X7FFFFF进行与操作,得到第一中间值;第二移位器,被配置用于
将以二进制表示的整数部分左移预设位,得到第二中间值,其中,预设位与转换指数的小数
位的数量相同;以及连接单元,被配置用于对第一中间值和第二中间值进行连接,获得以目
标浮点数为指数进行指数运算所得到的结果。
表示为A*2 ,其中,A为尾数,B为指数;步骤S302、对于所述目标浮点数,对二进制表示的所
述尾数进行划分,得到最高位的预设数量的目标子部分;步骤S303、通过查表获得所述目标
子部分的查表值,所述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得
到的结果;步骤S304、基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结
B
果;以及步骤S305、以对2进行预设对数运算所得到的结果,以及对所述尾数部分进行预设
对数运算所得到的结果作为输入,利用加法器获得对所述目标浮点数进行预设对数运算所
得到的结果。
处的泰勒展开所执行的拟合计算,确定最终的对数运算结果,能够有效减少所需存储的表
项数量,降低对芯片中的存储资源的占用,减小芯片面积。
个元素中的任意两个相邻的元素,当其中在先的一个元素处理至第二周期时,可以开始对
其中在后的一个元素的第一周期的处理,由此,能够有效地提升数据处理的效率。
目标浮点数a表示为单精度浮点数的具体形式为:
存储大量的表项以支持该查表操作。例如,在尾数的小数位位数为23时,需要的表项项数为
23
2 ,用以预先存储对尾数的预设对数运算的各种可能的计算结果。为了节省芯片内的存储
资源,可以将对二进制表示的尾数进行划分,得到最高位的预设数量的目标子部分,并针对
目标子部分执行查表,以此来减少需要存储的表项的数量。其中,目标子部分的最高位的预
设数量的位数越多,则计算结果越精确;目标子部分的最高位的预设数量的位数越少,则计
算复杂度越低,所需的表项数量越小。
少一部分阶数中的各阶导数各自对应所述目标子部分的导数值;以及基于所述查表值,以
及以所述预设值为底的预设对数函数的至少一部分阶数中的各阶导数各自对应所述目标
子部分的导数值,利用泰勒级数计算对所述尾数部分进行预设对数运算所得到的结果。
目标子部分处进行泰勒展开所得到的相应的至少一部分泰勒展开项的值,并以此拟合尾数
进行预设对数运算所得到的结果。
对应目标子部分的一阶导数值;基于一阶导数值,计算预设对数函数的至少一部分阶数中
的其它阶导数各自对应目标子部分的导数值。由此,可以至少通过泰勒展开式中的前两项
的值拟合对目标浮点数的尾数部分进行预设对数运算的结果。
运算结果E为:
于一阶导数值的平方和预设对数函数的二阶导数的符号位,计算预设对数函数的二阶导数
对应目标子部分的二阶导数值。
运算所得到的最终结果。
对目标浮点数的对数操作应用于模型波束的复数转实数层,以支持对浮点数的对数运算处
理。
示单元401,被配置用于将目标浮点数表示为A*2 ,其中,A为尾数,B为指数;划分单元402,
被配置用于对于目标浮点数,对二进制表示的所述尾数进行划分,得到最高位的预设数量
的目标子部分;第一查表单元403,被配置用于通过查表获得所述目标子部分的查表值,所
述查表值为对所述目标子部分进行以预设值为底的预设对数运算所得到的结果;确定单元
404,被配置用于基于所述查表值,确定对所述尾数部分进行预设对数运算所得到的结果;
B
以及加法器405,被配置用于接收所输入的对2进行预设对数运算所得到的结果,以及对所
述尾数部分进行预设对数运算所得到的结果,并输出对所述目标浮点数进行预设对数运算
所得到的结果。
单元,被配置用于基于所述查表值,以及以所述预设值为底的预设对数函数的至少一部分
阶数中的各阶导数各自对应所述目标子部分的导数值,利用泰勒级数计算对所述尾数部分
进行预设对数运算所得到的结果。
阶导数值,计算预设对数函数的至少一部分阶数中的其它阶导数各自对应目标子部分的导
数值。
计算预设对数函数的二阶导数对应目标子部分的二阶导数值。
数的小数部分和目标子部分之间的目标差值的平方;另一个乘法器被配置用于计算一阶导
数值和目标差值的乘积,得到第一乘积值;另一个乘法器被配置用于计算二阶导数值和目
标差值的平方的乘积,得到第二乘积值;多个子加法器被配置用于对查表值、第一乘积值和
第二乘积值进行求和,并且所得到的求和值为对尾数部分进行预设对数运算所得到的结
果。
置。
令被至少一个处理器执行,以使至少一个处理器能够执行上述任意一种对浮点数进行指数
运算的方法或上述任意一种对浮点数进行对数运算的方法。
上述任意一种对浮点数进行对数运算的方法。
浮点数进行对数运算的方法。
字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀
片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装
置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所
示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述
的和/或者要求的本公开的实现。
输入单元506可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能
控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作
杆、麦克风和/或遥控器。输出单元507可以是能呈现信息的任何类型的设备,并且可以包括
但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元508可以包括
但不限于磁盘、光盘。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电
信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设
备、无线通信收发机和/或芯片组,例如蓝牙TM设备、1302.11设备、WiFi设备、WiMax设备、蜂
窝通信设备和/或类似物。
能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任
何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例
如对浮点数的指数和对数计算方法。例如,在一些实施例中,对浮点数的指数和对数计算方
法其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部
分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。计算单
元801可以通过借助于固件,例如,芯片而被配置为执行对浮点数的指数和对数计算方法。
的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实
现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算
机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器
可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出
装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至
少一个输出装置。
理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的
功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电
子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合
适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计
算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM
或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD‑ROM)、光学储存设备、磁储存设备、或
上述内容的任何合适组合。
器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来
将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的
反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用
任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界
面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部
件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数
字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网
(LAN)、广域网(WAN)和互联网。
算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的
服务器,或者是结合了区块链的服务器。
实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者
可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步
地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述
的很多要素可以由本公开之后出现的等同要素进行替换。