登录
首页 嵌入式系统 嵌入式系统
回帖 发帖
正文

主题:STM32’s I2C 硬件BUG引发的血案(qzm)

点击:2420 回复:0

关键字:stm32, i2c, irq, bug, bus hang
2010-4-1 1:44,一直都不相信stm32 的i2c接口会存在问题,因为工作经验无数次告诉我,嵌入式系统设计中的99.999%的问题不会是由于mcu本身的设计问题所引起,绝大部分都是硬件工程师或软件工程师的某个设计缺陷所造成的. 这次的设计经历也不例外.
由于终于可以抽多点时间用于设计stm32的i2c的软件接口, 因此, 决定重构之前用于主从stm32通讯所用的i2c模块(基于i2c中断+状态机收发)。i2c的中断发送模块很快就重构完毕并且强化了错误处理和i2c总线hang的自恢复功能代码模块(i2c bus hang:也就是sda 和scl都被某slave device拉低,大部分发生在主机接收从机传过来的数据包的最后一个字节的数据时,没有发送p(停止位)所造成的,这时slave device (eeprom)因为接收不到p,从而会dead loop地发送数据给主机,在主机方向看,i2c总线就相当于一直处于busy的状态,也就是网上问得最多的关于i2c的问题-i2c总线tmd的怎么会突然间死掉了、busy了、hang的原因。)。
本以为i2c中断读模块也会很顺利地完成,但是却被卡住了一整天,只要加一个断点,在大部份代码处加无所谓,读fun每次都正确执行,但只要全速运行,就只能运行一次,然后就过不去了,而且过不去的地方并不固定。由于dubeg得有点集中不了精力,于是就做好问题的brainstrom的笔记,放了下,晚上出差到深圳,到客户处做系统需求的讨论会,主要是上位机部分的。然后第二天晚上又赶回来,在车上的半梦半觉中让潜意思去思考。回到家后,选择在我的生物钟的最佳的时侯,晚上10点。开始重新在问题的brainstorm处接着dubge。work plan如下:
(1)把程序恢复到测试i2c写的测试用例状态,pass。
(2)一小段代码就debug一次的步步为营方法,按之前的思路把代码加入到读的模块(忽略防守代码,只加入必需的功能代码)。都ok后,全速运行,xxx,又卡住了。细过了一片读模块。pass。于是进入计划中的(3)
(3)全速运行,然后在可能卡住的地方加上断点,而不是之前的先加断点,然后运行的方式(这种方式,已确认pass):
加了几处后,发现程序是在下面代码处卡住的:
[URL=https://32qjdg.blu.livefilestore.com/y1mmbgvpove0ysbbx15ojzqkhw6wpki87sqvaw64nkylmfaqxzvipzlhgqj0t3qxjag3ejvld0ucrxur1atf4lu0vbi0x03dv_aylpdx8_cdifoxlg6laealwdi1jscxvk0sub0gwglato8h_rubce2ja/image[3]%206f67cf7f.png]
https://32qjdg.blu.livefilestore.com/y1m-bz22hmhwwzv-otqzi0xdbmwcmvn2izcs-lgkpvwnpyx6zd7yrhmrjn4gspxcvtvy6mzn7ialjfohwubw8bthu8bdalovlkwqootll0rdryyj_niqgelefztihyaj3ifvnsjcjozm3xxtlt94yu3ow/image_thumb[1]%2000bd0620.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1m-bz22hmhwwzv-otqzi0xdbmwcmvn2izcs-lgkpvwnpyx6zd7yrhmrjn4gspxcvtvy6mzn7ialjfohwubw8bthu8bdalovlkwqootll0rdryyj_niqgelefztihyaj3ifvnsjcjozm3xxtlt94yu3ow/image_thumb[1]%2000bd0620.png
[/URL]
但是奇怪了,每次我只要在箭头指向的语句后加上断点,每次都能pass。于是知道要到 i2c_checkevent 函数中就能找到问题的原因了,于是做下面的几步,目的是把包含i2c_checkevent fun的链接库中的stm32f10x_i2c.o排除掉,而把stm32f10x_i2c.c加入到项目中,使得debug时能进入到 i2c_checkevent fun 中去.
[URL=https://32qjdg.blu.livefilestore.com/y1m7y7k8gg1skjhvo9c2htqp3f_rbbq3ttgm7tbosa9kkouxwtaecrw0cj9pxofstxr0-wqsrjep6kwwjcsa1u746ou4-jdskn0tj9djstkdcbzj3uo1ljb6vwjkmv1jjkpml6iym3puqfl34muufyoyq/image[7]%2076040e85.png]
https://32qjdg.blu.livefilestore.com/y1m9v2y5eeerm0ddrwxnadfrckomlo4hopeuxb3tyf0w8qur8vcuhhuk4zdq98_x4ob02sm8ixijubk2e7a8poafycxulfmzevguwhshoze2ilsthywg1fw3hdnwsp4qfegeo-ll6rau10gvnzrpkblnq/image_thumb[3]%20604637f6.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1m9v2y5eeerm0ddrwxnadfrckomlo4hopeuxb3tyf0w8qur8vcuhhuk4zdq98_x4ob02sm8ixijubk2e7a8poafycxulfmzevguwhshoze2ilsthywg1fw3hdnwsp4qfegeo-ll6rau10gvnzrpkblnq/image_thumb[3]%20604637f6.png
[/URL]
[URL=https://32qjdg.blu.livefilestore.com/y1mxmtkhvqoqg7jspxk8ffv4ninpjc6hvfo0ci2g6xqhk4_kdgq6psjaqs4xa-hoxgsdsotp5r7vzg3m5isdjxtw9yrrncxlpvuk1hrew1cdsiiae8h7qcta_ernxi71rhpam1si4e8g-yqbmvpcpp-fw/image[11]%2052e7155c.png]
https://32qjdg.blu.livefilestore.com/y1mhqe2d5vqrs_g-urnkuxdk1p8kl4cbxtghhhodazblvvz0npclxyjnserb-urw6vjwsaugdbftsdnio4kxvcudonveuzosto141tucra_lemshpro0rj49oyx9nlgd25dzal-catzdwuxw3aoxy6lag/image_thumb[5]%20078e6204.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1mhqe2d5vqrs_g-urnkuxdk1p8kl4cbxtghhhodazblvvz0npclxyjnserb-urw6vjwsaugdbftsdnio4kxvcudonveuzosto141tucra_lemshpro0rj49oyx9nlgd25dzal-catzdwuxw3aoxy6lag/image_thumb[5]%20078e6204.png
[/URL]
于是全速运行,然后在 stm32f10x_i2c.c中加上断点,终于捕捉到问题点了,分析如下图所示:
[URL=https://32qjdg.blu.livefilestore.com/y1mhranmfbykmohoccfsqfn3ueo5oogkfr-zoc3brzoh0o5ukmoo9o_uk55dgh0jgl9wa-zxdz6_9g0drjykwyktb2qg6s-_pb0p6grpk4hsplqu4dbx2hzzipbmlgkhjjjuro3wbodlozmghvatmbw4q/image[15]%203895031d.png]
https://32qjdg.blu.livefilestore.com/y1mnwwm_ofthqtnra9-qqmvbbogdxmlz24x46eyib8sdynkwkyb8y0hakzxbi8qpo6ks9es_a05r4cmkm7giwzkfpe6jwgg0bvfnhcqijdnfrp7xxbxy-klffgexjmfhjqopdo6censbvxv0ewisgdjig/image_thumb[7]%200e51dd10.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1mnwwm_ofthqtnra9-qqmvbbogdxmlz24x46eyib8sdynkwkyb8y0hakzxbi8qpo6ks9es_a05r4cmkm7giwzkfpe6jwgg0bvfnhcqijdnfrp7xxbxy-klffgexjmfhjqopdo6censbvxv0ewisgdjig/image_thumb[7]%200e51dd10.png
[/URL]
/* read the i2cx status register */
//  flag1 = i2cx->sr1;             // 原代码
//  flag2 = i2cx->sr2;            //原代码
//  flag2 = flag2
 /* get the last event value from i2c status register */
 //lastevent = (flag1 | flag2) & flag_mask; //原代码
 lastevent = (vu32)( (vu32)(i2cx->sr1) | ((vu32)(i2cx->sr2)
为了确认,我也把 fun中的所有变量改为以v开头的,以确保不被编译器所优化掉,编译代码也不作任何的优化。但是全速时i2c获得的事件会多出个btf位,而在一开始时如果先进入debug,加上断点,然后运行,
lastevent == 0x30001(之也说明了库代码是不存在bug的),
如下图所示:

[URL=https://32qjdg.blu.livefilestore.com/y1m4pdx3pk8ur5g82povywtd1vx-3kiajuj7ghtgvlnk0we0drscnefzzf2a3d3f5o4lz9yuaschutyqyj_wzakqdiiqqdrlagku4rya_kusddszxu4yrx_1e8-ndea0ovenmnsxv7q0xc72q3tmkwhma/image[19]%205e3182b8.png]
https://32qjdg.blu.livefilestore.com/y1m9oygpznmv2d5kgowxl4m36cu9sufuozj3bhmlsoqzyu_lzc-f_8pkyeg-jmji4lqghfafonaggudbqp1klqqccq2lahqpxka4g4ifffnwpbbarlspk4dpbtr9o6cd_euuukiabvjng7c4dwoadkdla/image_thumb[9]%207ad77fa8.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1m9oygpznmv2d5kgowxl4m36cu9sufuozj3bhmlsoqzyu_lzc-f_8pkyeg-jmji4lqghfafonaggudbqp1klqqccq2lahqpxka4g4ifffnwpbbarlspk4dpbtr9o6cd_euuukiabvjng7c4dwoadkdla/image_thumb[9]%207ad77fa8.png
[/URL]

这应该是stm32 i2c硬件接口的bug,解决方法如下:
[URL=https://32qjdg.blu.livefilestore.com/y1mx--0nhurrcvg1hqlgcuibz7x9qvnscnskn07gddnkjmfk8icolehrdav0bolwv2jmyr9biu7pzvn9sdw7pczvee3o4ydfadecj2rb6yfookhf-fatt8ooqaoikd6pzd1vyxgtirk971brnfvcbvcmg/image[23]%2045d47195.png]
https://32qjdg.blu.livefilestore.com/y1my3fvyumfbl6rfyojy4k0w_yl2x1ggsopgdc75bdrz1ars9tjy_mme_idx2cczrwmrn8ii1ubtar6ay3bherqrwivw9yiziw91kl6fcvcbet2xcxu0wlzw_nqsuqlbnk3j44szcdux7wwzn504wpyaa/image_thumb[11]%20471d6a2f.png">http://blog.gkong.com/https://32qjdg.blu.livefilestore.com/y1my3fvyumfbl6rfyojy4k0w_yl2x1ggsopgdc75bdrz1ars9tjy_mme_idx2cczrwmrn8ii1ubtar6ay3bherqrwivw9yiziw91kl6fcvcbet2xcxu0wlzw_nqsuqlbnk3j44szcdux7wwzn504wpyaa/image_thumb[11]%20471d6a2f.png
[/URL]

把库中的i2c中断事件判定结合sr1和sr2的思路相反
,我把读sr1和sr2明确地分了出现,并进行确认, pass, 给模块加上防守代码,做好文档, 至此,模块的生命周期进入到白盒测试和黑盒测试阶段.

----------------------------------------------
此篇文章从博客转发
原文地址: Http://blog.gkong.com/more.asp?id=112878&Name=zjcsharp
10-04-01 01:52

工控新闻

更多新闻资讯