koorio.com
海量文库 文档专家
当前位置:首页 >> 数学 >>

实验数据处理中曲线拟合方法探讨_图文

第 31 卷 第 1 期  2004 年 2 月

      成都理工大学学报( 自然科学版)      
JOU RN AL OF CHE NGDU U NIVE RSIT Y OF T E CHNOLOGY ( Science & T echnolog y E dition)

V ol. 31 N o. 1 Feb. 2004 

[ 文章编号] 1671-9727( 2004) 01-0091-05

实验数据处理中曲线拟合方法探讨

乔立山1 王玉兰1  曾锦光2
( 1. 成都理工大学信息与计算科学系, 成都 610059; 2. 宁波大学信息管理系)
[ 摘要] 曲线拟合是实验数据处理的基本方法之一。将曲线拟合方法归结为有理论模型和无理 论模型两类, 据此, 对曲线拟合的一般思路 和重要方法进行了讨论。对两类方 法进行了比较, 并 将它们联合用于对材料流变状态 的速率-微分型本构模型的曲线拟合。 [ 关键词] 数据处理; 曲线拟合; 最小二乘; 神经网络; 本构关系 [ 分类号] T P 274    [ 文献标识码] A

  曲线拟合是用连续曲线近似地刻画或比拟平 面上离散点组函数关系的一种数据处理方法。传 统的曲线拟合方法是用解析表达式逼 近离散数 据。而事实上, 随着近几年人工神经网络等一些非 线性理论的发展及其在曲线拟合领域的应用, 曲 线拟合已不再局限于解析表达式的拟 合理论之 内。将非线性理论用于曲线拟合, 使传统的方法得 到了发展与改进: 文献[ 3] 中, 作者将样条小波的 显式表达式应用于曲线的最小二乘拟合; 文献[ 4] 提出了一种适于曲线拟合的混合型径向基函数网 络; 文献[ 5] 提出了将 B 样条函数网络应用于曲 线拟合的思路。
因此, 曲线拟合方法总体上可分为两类: 一类 是由与数据的背景资料规律相适应的解析表达式 约束的曲线拟合; 一类是由几何方法或神经网络 的拓扑结构确定数据关系的曲线拟合。本文将这 两类拟合方法归结为有理论模型的曲线拟合与无 理论模型的曲线拟合, 据此, 对曲线拟合的一般思 路和重要方法进行讨论。对两类方法进行了比较, 并将它们联合用于对材料流变状态的速率-微分 型本构曲线的拟合。

1 有理论模型的曲线拟合

通过实验或观测得到量 x 与 y 的一组数据 对( x i, y i) ( 其中 i = 1, 2, …, n) , 各 x i 是彼此不同 的。我们希望用一类与数据的背景资料规律相适

应的解析表达式 y = f ( x , c) 来反映 x 与 y 之间的 依赖关系, f ( x , c) 称作拟合的理论模型 , 其中 c= ( c1, c2 , …, cn ) 是待定参数。当 c 在 f 中线性出现 时, 称为线性模型 , 否则称为非线性模型。有许多

衡量拟合优度的标准, 最常用的方法是最小二乘

法。

1. 1 线性模型的曲线拟合

已知与数据的背景资料规律相适应的解析表

达式为:

y = 0 + 1x 1 + … + px p +

( 1)

其中, 0 , 1, …, p 是未知参数, 服从 N ( 0, 2 ) 。 实验数据为:

( y i; x i1 , x i2 , …, x ip ) ,  ( i = 1, 2, …, n)

由( 1) 可知, y i 具有数据结构式 y i = 0 + 1x i1 + … + x ip ip + i,

( i = 1, 2, …, n)

其 中, 诸 1 , 2, …, n 相互独立, 且均服从 N ( 0, 2) 。根据最小二乘原理, 线性模型的曲线拟合问

[ 收稿日期] 2003-04-22 [ 基金项目] 国家 973 项目( G 1999022511) [ 作者简介] 乔立山( 1979- ) , 男, 硕士, 应用 数学专业. ( E-mail: qlishan@ 163. com )

·92·

成都理工大学学报( 自然科学版)            第 31 卷

题可化为下面线性方程组的求解:

n

Q = - 2 ( y i - 0 - 1x i1 - … -

0

i= 1

p x ip ) = 0

n

Q = - 2 ( y i - 0 - 1x i1 - … - p x ip ) x ij = 0

j

i= 1

( j = 1, 2, …, p )

从而, 唯一地确定未知参数 0, 1 , …, p。

1. 2 非线性模型的曲线拟合

非线性问题一般较线性问题处理困难。如果

通过某些数学变换能使被估参数以线 性形式出

现, 通常优先采用变换。文献[ 2] 将这类问题称伪

线性最小二乘问题。

多项式是其中的典型代表, 设多项式函数为:

p ( x ) = p 0 + p 1x + p 2x 2 + … + p n x n

如果我们令 p i= i, x n= x n, ( i = 1, 2, …, n) 。则可 以将其化为形如式( 1) 的线性形式。其它可化为线

性式的常用曲线类型如表 1。

表 1 可化为线性式的常用曲线类型 T able 1 T he common cur ve ty pes that can be
transfor med to linear models

函数表达式

变换后表达式

变量和参数的变化 YXA B

y = 1/ ( ax + b) y = ax b( a> 0)
bx
y = ae ( a> 0)

1/ y= ax + b lg y = b lgx + lg a lny = lna+ bx

1/ y x a b lg y lg x b lg a lny x b lna

ax

y=

2
b

-

2
x

2

2

xb x

=-

ya a

2

2

x / y x 1/ a B / a

大部分非线性模型( 如本文将要讨论的材料 流变状态的本构关系) , 并不能直接化为线性问 题, 这时一般要借助求解非线性方程组, 通过最优 化方法求得所需参数。最常用的最优化方法[ 2] 有 单纯形下山法、拟牛顿法以及 M arquadst 算法。另 外, 遗传算法( GA) 、免疫算法( IA) 的研究也为曲 线拟合中的优化问题提供了新的思路[ 6] 。
2 无理论模型的曲线拟合
在实际工程中, 有一些问题[ 3] ~[ 5] 规律性差, 理论模型难以确定, 或者根本不需要理论模型的 约束。这时, 一般由几何方法或神经网络方法实现 曲线拟合, 本文将其归结为无理论模型的曲线拟 合。 2. 1 曲线拟合的圆弧法
圆弧拟合是一种描绘通过观测点( 型值点) 的 几何拟合方法。它用分段圆弧代替曲线, 并且使相

邻两个圆弧有公共切线。这种方法归结为以下三 种情况:
a. 已知圆 O 和圆外两点 A 1, A 2 , 求圆 P , 使它 通过 A 1 , A 2 , 并且与圆 O 相切( 外切或内切) 。
b. 已知圆 O 和圆外一点 A 2, 求圆 P, 使它通 过 A 2, 并且和圆 O 切于点 A 1 。
c. 已知圆 O 1 和圆 O2 , 求圆 P, 使它和圆 O 2 相 切, 且与圆 O1 切于定点 A 。
根据上述三种情况可以确定圆的圆心坐标、 半径以及切点, 从而唯一的确定拟合曲线。 2. 2 神经网络拟合方法 2. 2. 1 曲线拟合中网络模型的确定原则
如果将人工神经网络的每个结点看成是一个 基本函数[ 1] , [ 7] ( 如图 1) , 则人工神经网络实质上 就相当于基本函数族网络, 它们在相应的权值 i ( i= 1, 2, …, 5) 作用下, 生成网络函数 Y , 可以将 其看成是泛化了的曲线模型。
图 1 神经网络的函数模型 F ig . 1 Functio n m odel o f neural netw orks
针对曲线拟合问题, 激活函数应该是连续的、 非线性的( 对非线性拟合问题而言) 。应用最普遍 的是 Sigmoid 函数, 其表达式为
Sc( x ) = 1/ ( 1 + e- cx ) 其中, c 为任意常数。而网络结构的选择一般要根 据实验数据的形式确定, 前馈型神经网络是最常 用的网络结构。具体地, 如果是单条曲线的拟合, 网络结构应该是单输入单输出的; 如果是多对曲 线的并行拟合, 还存在单输入多输出与多输入多 输出的网络结构。 2. 2. 2 常用的网络模型及其学习算法
a. BP 网络: 神经网络拟合方法中, BP 网络拟 合是最常用的方法, 也是其它神经网络拟合方法 的基础。根据映射定理[ 1] : 给定任一 > 0, 一个连
∫ 续矢量 h, 矢 量中的各分 量满足 [ 0, 1] n hi( x ) dx
存在, 且 h 完成映射

第1期

乔立山等: 实验数据处理中曲线拟合方法探讨

·9 3·

h: [ 0, 1] n Rn → Rm 则必定存在一个三层 BP 神经网络来逼近 h, 且使 逼近误差保持在 之内。所以, 一个三层 BP 网络, 在隐单元可以自由设定的前提下, 能够实现以任

意精度完成曲线拟合。在拟合过程中, 为加快学习 速率和尽可能避免陷入局部极小, 除了传统的 BP 算法外, 人们提出了一些改进的算法[ 9] : 如, V ogl

快速算法、二阶 BP 算法、二阶快速 BP 算法以及

自适应 BP 算法等。

b. 径向基函数( RBF ) 神经网络: 作为一种曲 线拟合器, 也适合拟合任何非线性曲线。径向基函

数神经网络的主要优点是收敛速度快, 但需要比 标准反馈式 BP 神经网络更多的神经元。RBF 隐

层单元的特性函数采用非线性的径向基函数, 最

常用的是高斯型函数

Rj =

A e- ( x-

j) 2/ 2

j

2
,

 (

j

=

1, 2, …, N )

式中, N 为隐层单元数, Rj 是隐层第 j 单元的输

出, x 是输入模式, j 是隐层第 j 个单元高斯函数 的中心。通过隐层将输入样本空间映射到高维的

径向基函数空间内, 对输入层的激励产生局部化

响应。输出结点则对隐结点的基函数输出进行线

性组合。适合 RBF 网络的学习算法有 L MS 算法、

径向 基函 数相关 矩阵奇 异分解 法、快 速卡尔 曼

( FK) 算法以及基于误差梯度为 0 的递推最小二

乘( RL S) 算法等。 此外, 文献[ 4] 在普通径向基函数的基础上,

提出了混合型径向基函数网络; 文献[ 5] 提出的 B

样条函数网络等, 都为特定的曲线拟合问题提供 了新的解决方案。

3 两类曲线拟合方法的比较

有理论模型的曲线拟合( 主要指最小二乘拟 合) 与无理论模型的曲线拟合( 主要指神经网络拟 合方法) 代表了曲线拟合方法的两个方面, 它们既 有联系又有区别:
前者是由与数据的背景资料规律相适应的解 析表达式约束的曲线拟合, 适合处理简单的、线性 问题, 一般根据最小二乘原理将问题转换为方程

组的求解, 具有严谨的数学基础; 而对于非线性最 小二乘则要借助于求解非线性方程组或最优化理 论来解决, 这就增加了问题的处理难度。后者是由 几何方法或神经网络的拓扑结构确定数据关系的 曲线拟合。与前者不同, 神经网络方法适合处理复 杂的非线性问题, 并且可以实现多组曲线拟合的 并行处理; 但是没有理论曲线模型的限制, 从而不 能直接用于对理论模型有严格要求的曲线拟合问 题, 并且网络结构的选择和处理结果具有一定的 主观性。
两者的联系体现在, 由神经网络拓扑结构决 定的网络函数可以认为是泛化了的曲线模型, 并 且网络权值的修正一般是基于最小二乘原理的。

4 实例分析

本构方程理论是非牛顿流体力学和近代材料

科学的理论基础, 本构曲线的拟合在其中具有重

要的意义。材料的本构关系通常是高度非线性的, 本文将韩式方提出的速率-微分型本构方程 B 模 型[ 8] 作为曲线的理论模型, 用最小二乘方法, 结合

神经网络, 实现对实验数据的曲线拟合。测得实验

数据如表 2。

材料流变状态的速率-微分型本构方程 B 模 型:

=

0[ 1 + ( 1 2 + 1 1 -

1+

22 1

2) 2]

( 2)

其中 0, 1, 2, 1 , 2 为待定系数。令

a=

1 2+ 1 1-

2, b =

2 1

我们简化上式为:

=

1+ a 2 0 1+ b 2

( 3)

根据最小二乘原理, 即是要求 0, a, b 使

i

1+ 01+

a b

2 i 2 i

-

2 i

达到最小。容易看出, 问题需借助于最优化的理论

来求解。并且随着数据量的增加问题将变得越复

杂。而由( 2) 式知, 曲线通过原点, 且原点的函数值

恰为 0, 所以我们可以用神经网络模拟零点的

值。针对实验数据是一组点对的特点, 我们选用了

表 2 实验数据 T able 2 Ex perimental data 0. 233, 0. 462, 0. 818, 1. 554, 2. 841, 5. 393, 9. 861, 18. 721, 36. 907, 72. 759, 128. 097, 234. 19
35. 741, 34. 338, 31. 459, 27. 054, 20. 843, 13. 224, 11. 002, 10. 758, 8. 422, 7. 719, 6. 566, 6. 361

·94·

成都理工大学学报( 自然科学版)            第 31 卷

如图 1 所示的网络结构, 只是根据需要增加了网 络的隐层单元和隐层数。计算机模拟结果显示, 两 个隐层( 每个隐层三个神经元) 的 BP 网络模型, 就能达到很好的拟合效果, 网络学习算法如下:
a. 设置各权值 j i( 0) 和阈值 j ( 0) 为 0 和 1 之 间的随机数。

b. 提供训练样本: 输入为实验数据 , 期望输 出 为 , 对每个输入样本进行下面( c) 到( e) 的迭 代。
c. 计算网络的实际输出及隐层单元的状态, 其中, S 为 Sigmoid 激发函数

oj = Sj

jioi + j

i

  d. 计算训练误差:

j = oj ( 1 - oj ) ( tj - oj ) , ( 输出层)

j = oj ( 1 - oj )

m mj , ( 隐含层)

m

  e. 修正权值和阈值, 其中 为按剃度搜索的

步长, 为常数

ji( t + 1) = ji( t) + j oi + [ j i( t) - j i( t - 1) ] ,

j ( t + 1) = j ( t) + j + [ j ( t) - j ( t - 1) ] ,
  f . 判断指标是否满足精度要求: 即当

E=

1 2

j

dj - oj 2 <

后结束, 否则进入( c) 。

根据网络当前的状态模拟待定系数 0 =

36. 1820, 如图 2 所示。通过简单的数学变换, ( 3)

式可化为:

0
-

=
0

1 a-

b

1 2

+

b a-

b

令:

Y = 0/ ( - 0 ) , X = 1/ 2 ,

A = 1/ ( a - b) , B = b/ ( a - b)

根据线性最小二乘原理, 求得 A 和 B, 进而求得 a = 0. 0607, b= 0. 2883。拟合结果如图 3 所示。可以 看出, 该方法具有较好的拟合效果( 平均相对百分 误差为: 3. 1232% ) , 并且可以避免繁琐的最优化 过程, 是一种直观、有效的曲线拟合思路。其中, 由 于实验数据后端的 值相对前端的 值小, 对曲 线拟合整体的贡献较小, 因此, 在对数坐标系下出 现了后端拟合效果较前端差的情形。
图 3 拟合效果图 F ig . 3 Fitt ing result
5 结 论
a. 曲线拟合的一般思路: 线性问题, 根据最小 二乘原理, 将问题转化为线性方程组的求解; 非线 性问题, 如果可以通过某些数学变换化成线性, 通 常优先采用变换, 不能化为线性的要借助于求解 非线性方程组或最优化理论来解决。如果实际问 题对理论模型没有要求, 则神经网络是快捷、实用 的新型方法, 可以达到较高的拟合精度。
b. 将神经网络学习和模拟结果用于有理论模 型的曲线拟合问题, 可以使问题更易于解决。在对 问题要求精度允许的范围内, 是一种直观、有效的 曲线拟合思路。通过实例验证了这一思路在解决 实际问题中的应用。

图 2 神经网络模拟实验图 Fig. 2 Simulated picture of neur al netw or ks

[ 参考文献]
[ 1] 靳蕃. 神经计算智 能基础原理方法[ M ] . 成都: 西南交 通大学出版社, 2000.
[ 2] 张志涌 . 精 通 M A T L A B[ M ] . 北 京: 北京 航空航 天大 学出版社, 2000.
[ 3] 郑小萍, 莫金, 谢天尧. 一种新型的曲线 拟合技术在分 析信 号处理中 的应用 [ J] . 计 算机与 应用 化学, 1999,

第1期

乔立山等: 实验数据处理中曲线拟合方法探讨

·9 5·

16( 5) : 371- 372. [ 4] 李贵 存, 刘万 顺, 宫 德锋, 等. 用 于磁化 曲线拟 合的高
精 度 混 合 型 径 向 基 函 数 神 经 网 络 [ J ] . 电 网 技 术, 2001, 25( 12) : 18- 25. [ 5] 郝继升, 孙 美全, 刘彦保 . B 样条函数网 络应用于曲线 拟 合[ J] . 延安大学学报, 2000, 19( 1) : 18- 21.

[ 6] 邵学 广, 陈 宗海, 林 祥钦. 一 种新 型的 信号 拟合 方法 免疫算法[ J] . 分析化学, 2000, 28( 2) : 152- 155.
[ 7] 杨建刚. 人工神经 网络实用教程[ M ] . 杭州: 浙江大学 出版社, 2001.
[ 8] 韩 式方. 非 牛顿流体 本构方 程和计 算解析 理论[ M ] . 北京: 科学出版社, 2000.

Discussion on methods of curve f itting in experimental data processing
QIAO L i-shan1, WANG Yu-lan1, ZENG Jin-guang2
( 1. Dep ar tment of I nf ormation and Comp uting Science, Cheng du U niv er sity of T echnology , China; 2. D ep artment of I nf or mation M anagement, N ingbo U niver sity , N ingbo, China)
Abstract: Curve f it ting is one of the basic met hods in experimental data processing. In t his paper, t he methods of curve fitt ing are classif ied by existence of theoret ic model. According t o t he above classification, t he paper discusses t he general and import ant m et hods of curve fitt ing. T hen it compares t he tw o species of m ethod and addresses a new m et hod based on neural net w orks and least square. Finally, t he new method is used f or curv e f it t ing of rheologic model velocit y-diff erential const it ut ive relations. Key words: dat a processing ; curve fitt ing; least square; neural net w orks; constitutive relat ions

( 上接第 90 页)
( 科 研报告 文献) 作者. 报告 名称[ R] . 报 告保存 地城 市名: 报告保存单位, 提交报告的年份.
4. 论文要做到 论点明确、文字通顺、数 据可 靠, 文责自负。
5. 为确保论文集出版, 征文截止日期为 2004 年 6 月 30 日。
6. 征文最好采用电 子邮件发送给会议 联系 人, 格式为 Word 文件。如邮寄纸质稿件需同时附 文章电子稿软盘。
四、会议日期及地点 1. 开会时间: 2004 年 9 月, 具体时 间见以后 通知。 2. 会议地点: 成都理工大学( 暂定) 。 五、主办单位 四川省地质学会 四川省土地学会 四川省国土经济学研究会 四川省矿业协会

四川省旅游协会 四川省生态学会 四川省矿物岩石地球化学学会 六、承办单位 成都理工大学 七、会议回执及征文联系人 1. 朱 创业: 成都理工大学地球科 学学院( 邮 编: 610059) , E-mail: zcy @ cdut . edu. cn, 联 系 电 话: 028-88012821; 84078815; 2. 袁   兵: 成 都 理 工 大 学 科 技 处 ( 邮 编: 610059) , E-mail: yuanb@ cdut. edu. cn, 联系电话:
02 8-840 7892 5; 3. 秦 钢: 四川省地质学会( 成都市人民北路
一段 23 号, 邮 编: 610081) , E-mail: scdh@ etang. com , 联系电话: 028-83224539; 89096080;
4. 焦家义: 四川省地质学会( 成都市人民北路 一段 23 号, 邮 编: 610081) , E-mail: scdh@ etang. com , 联系电话: 028-83224539; 83224539。


网站首页 | 网站地图
All rights reserved Powered by 酷我资料网 koorio.com
copyright ©right 2014-2019。
文档资料库内容来自网络,如有侵犯请联系客服。3088529994@qq.com