10,经验分享-主板类_主板的类型包括哪些

createh52周前 (03-02)技术教程2

2,主板类

2-1,广达云达QTC T41S-2U不能上v4(BIOS:3B12或者3B14),升级bios(3B06)后只能上1颗V4点亮,后升级bmc(从3.16升级到3.44)可上两颗v4,但web后台log报错:BMC FW incompatible --with CMC FW.原bmc是3.38时和3.44的报错相同。去年有24盘的也是只升级bios就能上v4且不报错,bmc版本信息为23.52.00。

夹层阵列卡安装后不能被识别,在
bios--Advance--CSM---storage中打开

2-2,有7片X11DPFR-SN REV:1.01主板装某个测试版cpu卡在cpu自检过不去(原bios是2017年,升级2020年bios前是加电掉电不断重启),但某些此型号的主板又支持(bios是2017年未升级的),对调过这两种板的bios和bmc芯片也不行。未解决

测试版cpu,客户说是QL1L,6138的es版,20核心 1.8的主频

但从bios显示的信息来看,主频1.8G,L3=28160K=27.5MB对应,cpu型号应为6222或者6222v

Intel官方网站参数对比如下:

https://ark.intel.com/content/www/cn/zh/ark/compare.html?productIds=193962,192441

2-3,DELL C6420不支持8171M,实测可支持8160

2-4,DELL R530xd不支持v4,也不支持2699v3,咨询过400电话未果。2690v3支持。

2-5,华为Tecal XH310V2 imana无法升级,提示升级失败,且ssh登录不进去(输完密码后连不上)的现象:web后台关机后,正常的机器电源和风扇状态指示为绿色,无法升级的机器呈灰色

2-6,华为RH1288 V2升级imana失败,进度0%,版本:6.09以前(不包含6.09),原因:cron没有周期性调用压缩脚本,dbg与oplog都有可能出现大文件,导致flash空间不足会导致固件升级失败。解决:删除掉大文件后,可正常升级。命令如下:

root@BMC:/date/share/oplog#rm filename

2-7,华为RH2285 V2 imana 3.76 需要升级到新版本 7.31,主用iMana升级成功,备用iMana版本升级失败

升级失败可能是BMC内存不足导致,内存不足的情况下会触发OOM Killer杀掉内存占用率高的进程,从而导致BMC软件不能正常升级

登陆iMana,执行命令行ipmcset -d reset重启iMana后,重新升级备iMana成功。

2-8,DELL R730xd DRAC IP拼不通,初始化时显示idrac is not ready,拔掉硬盘背板和耳朵开关以后正常,后排除是耳朵开关的问题

2-9,华为2288V3 进bios需要密码,把bios降到最低,密码即自动清除,再升级bios即可。或者直接编程bios芯片。

2-10,LENOVO RD350X BMC版本:1.1.987 JAVA6可用,7、8会报错打不开

2-11,DELL IDRAC6 可在DOS下更新 BMCFWUD.EXE -c

2-12,DELL R720遇到一台ping bmc ip时有延迟,bmc后台操作不流畅,上传固件成功后,队列任务里提示正在下载但过会提示失败,F10里也尝试过升级,均失败,猜测为bmc芯片故障。

2-13,HUAWEI RH1288V3普通机器接NVME背板,bmc用2.6x、3.x时会报SAS线错误,用2.02时bmc不报错。若是原装的RH1288V3 NVME背板平台,即可升到最新也报错。

2-14,浪潮5212M4 自检时卡在“99”后不往下进行,或者自检码无变化 机器不亮但风扇状态正常的,可重新刷入bios程序试试。

2-15,DELL C6320上E5-2696v4点不亮,上E5-2690v4可以

2-16,DELL T3500工作站板子通电一会就断电,拔掉前面板线故障依旧排除开关短路,cpu换过,换普通电源故障依旧,多为主板问题

2-17,DELL R920报主板电压或者cpu电压超范围,有可能是内存板故障引起的主板锁定,解锁步骤如下:

1,移除可能故障的内存板

2,断开电源线,长按开机按键10秒

3,接上电源线,但不开机,等待2分钟以确保idrac完成自启动(可观察主板中部led灯的变化)

4,短接J_DBG_CPLD1跳线组的1,2针,持续短接约10秒左右,然后检查前液晶板的报错是否消失

2-18,X10DRT-PS-LC009主板BIOS--Advanced--IOU PCEe Port里可以改auto为拆分模式,

其中port1共三种:auto,x4x4,x8

port2共六种:auto,x16,x8x8,x8x4x4,x4x4x8,x4x4x4x4

port3共六种:auto,x16,x8x8,x8x4x4,x4x4x8,x4x4x4x4

port1,2,3的实际位置在:

拆分后可以识别无拆分芯片的PCIE转多个NVME扩展卡,但要注意:(以下6点来自某宝卖家温馨提示)

2-19,DELL R430和R530的主板相同,当把R530机器的CP线(前面板处)拔掉后,识别的就是R430了

2-20,把DL360Gen9主板放到DL380 Gen9机壳里,显示DL380 Gen9,说明这两个型号的主板是可以通用的,显示的型号可能与之相连的硬盘背板有关。

把1288V3主板放到2288V3机壳里,--->没必要,power、fan位不对,扩展槽位、数量不同。

2-21,DELL R610、R710显示器不亮 前面板也不报错(包括打开盖子)声音状态正常,重刷了BIOS和BMC后无效,未解决。

2-22,广达K800-1G主板单独使用的话,必须重写BMC芯片(用ZT国际2011主板的BMC数据),否则会不间断重启,不重写的话,必须接带RPM功能的风扇,至少2个,位置:fan1-fan3任意一个 加上 fan5-fan7任意一个 Remote control实测可支持java5、6,7以上直接报错打不开

2-23,DELL C6220从bmc里更新bios ,选.exe格式;更新bmc选.dcs格式(15.xMB)

2-24,HP DL580 G9上测试版cpu,QGUM 2.2G--->E7 4850V3 QKSH 2.0G--->E7 4830V4 QKT3 2.0G--->E7 8890V4 DL580 G9可支持

HP DL580 G9 所用电源有3种

1,HPE 1200W Common Slot Platinum Plus Hot Plug Power Supply Kit 656364-B21

2,HPE 1500W Common Slot Platinum Plus Power Supply Kit 684532-B21

3,HPE 1200W Common Slot Platinum Hot Plug Power Supply Kit 748287-B21

2-25,曙光I620R-T/浪潮SA5248L/超微四子星:

1,按开关键电源灯会由橙变绿,但是刀片不启动(确定电源好、刀片好),可能就是耳朵上开关的问题---->若确定不是耳朵开关问题,则可能是电源分线器的问题

2,按开关键电源灯橙色闪几下绿色后还保持橙色,但是刀片不启动(确定电源好、刀片好),是机壳里的电源分线器问题。

曙光I620R-T I620-T10/浪潮SA5248L---超微X9DRT-HF主板,开机自检卡在F9,可刷BIOS芯片(主板正面SOP8)恢复,BMC更新失败,可刷BMC芯片(主板背面SOP16)恢复。

自检到“15”时过一会就关机---->BMC程序坏

启动几秒后自动关机----->电源分线器的故障率高

刀片启动,前开关状态正常,但听声音机箱风扇未达到正常速度,显示器无信号----->电源分线器故障。

##注意:修复机壳问题,注意开关线的连接,线有无外伤,主板供电板的金手指是否外伤,对应的硬盘背板接口是否外伤,用确定是好的开关、刀片、电源去测试刀箱,确定好了是刀箱的问题后,进一步排除是刀箱哪个部件的问题,##

bmc更新后无法获取到ip---->未解决。

X9DRT-HF超微刀片主板bios升级之前需要先更新bmc,bios ver3.3升级后bmc无法更改静态ip,系为bios版本bug,更换bios版本3.2a后OK

X9DRT-HF,供电板上的smc2108阵列卡(类似9260-8i)升级完固件后接的硬盘也是仅识别到2.18T(实际安装为2.4T)。

2-26,针对华为2285 v2 BMC DHCP时无法获取到IP,改成static时又ping不通的情况下如何升级bmc。

使用iso文件:
FusionServer-oem-FW-V119.iso SIZE:388MB(光盘工具包里有,源文件在我的电脑--->D:\E\Server Support\HUAWEI)

刻成光盘 第一启动项选择从光驱启动

用键盘上下键选择“Toolkit”,按“Enter”。

进入Toolkit主菜单界面。

按C进 Command line 模式

linux用户名密码 root Huawei12#$

步骤:

cd /home/Project/tools/upgrade/bmc&bios/

#chmod 777 Project #可能需要为 Project 增加权限

执行以下命令,升级BMC固件(或以下命令在linux下操作)

./hwupg -t bmc -u image.hpm

执行以下命令升级BIOS固件。

./hwupg -t bmc -u biosimage.hpm

#完成整个过程约需要40分钟

方法思路:

以升级阵列卡固件的iso为例,把bmc固件、bios固件添加到这个iso的
/Project/tools/upgrade/bmc&bios/目录下,重新刻盘

再参考这个说明升级:

https://support.huawei.com/enterprise/zh/doc/EDOC1000061912/ee7776b5

升级阵列卡固件的iso:

https://support.huawei.com/enterprise/zh/software/21657123-SW1000130573

2-27,IBM X3250 M4 进bios的IMM--network config 会自动重启--->扣电池,短接电池底座的正负极一会儿好(可再加上clear cmos跳线)

2-28,DELL R910可通过ST号查出厂时的内存板代数,通过bios升级能上E7-48XX(必须装II代内存板,上一代会卡住,提示无可配置内存,系统停止),一代内存板只支持E75XX cpu。II代内存板从外观上识别会有"II"标志。

最少配2个电源,2个cpu(cpu1+cpu2,,1个内存板接A位)。一代内存板不识别单根16G最大单根8G,二代内存板+E7-48XX cpu可以识别单根16G。

CPU与内存板对应关系:一个cpu管理2个内存板(cpu1--A+B位,cpu2--C+D位,cpu3--E+F位,cpu4--H+G位)

注意:1,内存板不支持单根内存,最少2根(1,2槽)。 2,不同内存混插,大容量优先插白色槽。

2-29,R720xd 装20个三星860EVO 500GB SSD用MINI H710 或者 MINI H710P 最多认十个,十个以后卡在阵列卡自检 多会儿后提示阵列卡无响应,用MINI H310可以或者 lsi 9720cv-8i也可以(PN:040KCJ)

2-30,华为T3500 G2 4U 24 3.5盘位(分布式存储系统子节点)只能用原机带的阵列卡(PN号为:STGPSCA01 REV.B,用PERC H310、LSI 9260-8I等认不全硬盘),它的背板也是不支持4T盘的(用H310 9260-8I能认4T的卡,把4T盘放到能认的盘位上,也识别不出来)

2-31,DELL R620 750W*2,冗余策略测试过程如下:

冗余策略:非冗余 热备份:无

此时PS2:0.2A PS1:0.4A

拔掉PS2后 PS1:0.4A(等待1分钟后看的读数)

再插入PS2后 PS1:0.4A PS2:0.2A (等待1分钟后看的读数)

拔掉PS1后 PS1:0.4A PS2:0.2A (等待1分钟后看的读数)

冗余策略:非冗余 热备份:启用 主电PS1或者选PS2

最后的读数都是:PS1:0.4A PS2:0.2A

冗余策略:输入电源冗余 热备份:启用

设置主电为PS1 此时PS2:0A PS1:0.4A

拔掉PS1后 PS2:0.4A(等待1分钟后看的读数)

设置主电为PS2后 PS2:0.4A PS1:0A

拔掉PS2后 PS1:0.4A(等待1分钟后看的读数)

冗余策略:输入电源冗余 热备份:无

PS2:0.2A PS1:0.4A

总结:1,不管什么冗余策略,任意拔掉一个电源都不断电

2,若选无冗余,则热备设置无效

3,哪个电源设置热备,它的电流即为0A

2-32,R620 intel I350 mini四口网卡 bios里能识别,centos6.5下用ip a 识别不到(以前的经验是这个网卡在centos6.5下能直接识别到),用 lspci | grep -i 'eth' 能识别到,怀疑是卡的问题--能识别到,但装不上驱动,类似window下在设备管理器里能认到,但是驱动打感叹号,最后升级网卡固件后好(在R620 F10里升)

2-33,DL380P G8 web后台提示传感器12温度高---->硬盘,经查为普通SAS盘,东芝盘体。

2-34,HP ML350P G8 接上缓存和电池以后 1分钟内会宕机,不接就好(换过好的缓存和电池后问题依旧)---->主板问题

2-35,广达QSSC-2ML 2660V2*2 8G*4 SATA 500GB WIN7-64。在BMC的日志整理:

85°C严重警告,系统日志最高读到85度的临界温度,再高就读取无效了。可在首页的传感器状态看超过85°C以后的实际温度

当每个核心都到86°C以后,2-10分钟之内会自动关机,但不会重启(bios 的 AC lost status为power on)

主板的6个sata口 sata0&sata1为6Gb(蓝色)其余四个为3Gb,还有8个SAS口

2-36,HP Z820 Update Bootblock

Jumper settings for updating boot block:

put a jumper on E14 & put a jumper on E1 (pin 1 & pin2)

- make sure to remove E14 after bios update.

- make sure to put E1 jumper back to previous pins (pin2 & pin3) after update.

2-37,Lenovo R510 G7 FAN报警,可在BIOS--健康管理里关闭或者 BIOS--clear log里关闭

2-38,DELL C6100 只上单电的话前指示灯红黄交替闪,日志报:AC POWER INPUT LOST ,如下图在FAN CONTR BD上加2个跳线帽短接即可

2-39,DELL R420:冷电550w,E5-2450*2,16G PC3L-10600R*8,sata2t*4 H710 MINI 报电源功率不够

期间少接1个硬盘,或少插点内存条 都不报此错。尝试升级过BIOS、整体的固件(F10联网升级)都不行。最后得知冷电源的550w是官方发布的最低端的机架结构,如此多硬件的扩展会增加机器的功耗,要换双电的550w热拔插才行。

2-40,HP SE316M1 把主板拆出来做组装机 用双6核心的cpu 使用过程中报错:信号风扇丢失会报 (system is too hot or has lost cooling)BMC里: temp 17温度超过51°C也会报此错误(官方临界温度52-57°C)。 开四个基准测试 cpu使用率在94%以上 temp温度在49度,fan转速在89% 可以正常。--->关掉bios中 cpu HT选项是目前最好的解决办法......最终还是主板temp17温控传感器散热问题。(在原装机壳里没问题)

2-41,在DELL 11代服务器内存模式有三种,Memory Optimized Mode、Advanced ECC Mode、Mirror Mode。区别在于

Memory Optimized Mode:

DDR3的内存控制器都在CPU上,每个CPU上有三个独立的Memory Controller Hub(MCH)。在这个模式下,MCHs是独立工作的,一个可以读,一个可以写,一个可以空闲。内存可以安装在one、two、three chanels上。这也就意味着有些不符合常规的内存接法可以正常工作。比如3G,6G,12G。

Advanced ECC Mode:

这个模式下,将两个MCH绑在一起变成一个128位的总线,另外一个MCH无法使用,如果开启这个模式并在剩余的MCH上接内存,机器就会报错。

Mirror Mode:

这个模式下,系统应用三个chanel中的两个,每个chanel写同样的数据,读的时候采取轮询的方式。如果发现有一个chanel的内存出错,系统会自动屏蔽此chanel。运用这种模式,能使用的内存容量是安装上去的一半。

假设有9个dimm,一共有三个chanel,A1A4A7 一个chanel;A2A5A8一个chanel;A3A6A9一个chanel.而Advanced ECC Mode 和Mirror Mode只能用到两个MCH,也就是只能使用两个chanel,默认是将A1A4A7这个chanel闲置。

总结:如果每个CPU的内存条数为1,3,9就只能使用Memory Optimized模式,2,4,6条数的都建议使用Advanced ECC模式。Mirror排除在外。

参考资料:

http://www.dell.com/downloads/global/products/pedge/en/ddr3_white_paper_r410_en.pdf

http://www.dell.com/downloads/global/products/pedge/en/server-pedge-installing-upgrading-memory-11g.pdf

2-42,DELL PE6800/6850,标准情况下,一台机器里应该有一个CPU3 VRM和一个CUP4 VRM,两个模块编号相同,共两个,外观较厚。四颗CPU时,不装CPU3&4 cache VRM(一个机器就一个,外观较薄),机器也亮。三颗CPU时,只装CPU3 VRM 即可。6850 667/800外频的模块均适用于6800(估计是向下兼容)

2-43,华为6G、12G阵列卡装windows时能认到盘,回车时提示无法安装到这个硬盘——>bios重置+硬盘数据清掉一般都能解决,或升级阵列卡固件,linux未发现有此现象。

2-44,华为网卡在bios里读取不到mac地址,或web后台读取的状态不对,都是有问题的

2-45,R620 10盘位的风扇转速高,和8盘位的不同

2-46,华为V3H高配的风扇为两组扇叶,低配为一组

2-47,DELL C6320自检到最后有一个窗口提示的话,2008夹层卡是进不去webBIOS配置界面的---->升级bios

2-48,HP 380E 3.5*12盘机头只能往380p 3.5*12盘或3.5*8的机器里放,其他盘位的话耳朵上的VGA线不够长。长线(大盘)的号660714-001,大概比短线长3cm。短线(小盘)的号654590-001

660719-001 Discovery services connector,发现 服务 连接器 [DS Cable黑红两条线 ],一端在左耳朵上,一端接主板,不知道具体做什么用。

2-49,实测69Y4494(X3630M3) sas线可用在DL380 G9 2.5*8上,可理线,可认盘,不报错。

2-50,5248M4,实测可上E5 2698R V4,pcie扩展槽上可装nvme固态装系统且可引导,若是刀片引起的开关无效或者开关灯不亮,可能跟刀片上的长条形供电板有关系

2-51,DELL R730xd 2.5*24盘和3.5*12的后置背板SAS线是不同的,(信号线和供电线相同)24盘:8KX9H 12盘:8RJM1,24盘上用8R的线会提示错误:CBL0009 sas线未连……

2-52,华为RH2285H V2 RH2285 V2 用3个sas口的背板直连主板时SAS3--接主板minisas1,sas2--minisas2,sas1--miniSATA 不然背板灯不正常,前面板健康灯亮,后台提示背板配置错误

用3个sas口的背板接阵列卡时SAS3--接主板minisata,sas2--portB,sas1--portA

2-53,机器:C6320+PCIE H330+SSD 十几台。客户系统:

Kstack-v2.1.2.iso(centos7.6定制),问题描述:仅几片是可以安装系统的,多数机器安装系统时系统初始化过不去。

问题前期分析:

1,若是客户系统问题,但

a,我们的环境下 通过idrac后台加载客户系统iso镜像文件可安装

b,在我们的环境通过idrac加载客户系统iso 在R720 R730 C6220环境上都可安装

c,有几台节点是能安装好的

2,若机器有问题,但

a,在不能装客户系统的机器上安装centos7.6是可以的

b,出货前安装过数台centos6.5的系统是可以的

c,用u盘安装客户系统时,系统自检过不去,说明客户系统是不支持刻录u盘为媒介安装的

3,客户机器查无硬件报错

综上1,2,3点矛盾对比,客户系统的问题大

……

后客户反映,拔插阵列卡后,基本好了一半数量,剩下一半不好的,从legacy改成uefi后也能安装了,经查,不好的阵列卡固件都是最新的,好的都不是最新的,解决办法是尝试降级阵列卡固件版本试试,分三步走,

1,用我们现成的H730升降级固件都ok---->此步骤行不通

2,采购H330升降级试试---->未采购

3,返回客户的H330升降级试试---->未返回

最终原因:卡的PN号问题,换成接口不超过板基的那种,朝后(是14G用的)或朝上(这种最好理SAS线)。再次比较得:能用的阵列卡自检时显示no-raid模式,在bios里、idrac后台里均可查看、配置磁盘;不能用的自检显示JBOD模式,在bios里无法查看到阵列卡和查看配置磁盘,装定制版的系统用legacy模式有自检不过的情况,用uefi正常。

2-54,T5600工作站,2670*2,用625w电源报功率错,用825w ok

2-55,IBM X3550M4的电源能用在X3650M5上,但是后台读不出正确的pn号,无加电时间和实时功率。

RD350X/RD450X用X3550M4的电源无法启动。

2-56,R730 2.5*16盘位,用RD450X 12-6的sas线,用9210-8i、9211-8i、9240-8i实测无报错,硬盘活动、状态指示灯都正常亮。内部的双sd模块做raid1安装esxi成功,可启动。

2-57,380G8.ILO=1.50时,此项(Embedded Flash/SD-CARD)为子菜单,自检时提示错误,后台登录页不提示。ILO=2.61时,此项为主菜单,自检(self-test error)和后台登录页(Embedded Flash/SD-CARD error)会出现错误提示。当把BIOS更新后,ILO固件改成2.55后正常,G9相同。

2-58,富士通CX400 S2,有bmc后台,但无虚拟控制台。广达D51B-1U升级完成后,只能上单颗V4,双颗不亮,可尝试把官方.bat文件里关于升级BMC的命令挪到最后,即先升级bios,再升级bmc。

相关文章

jar不能双击运行(命令行可以执行)的解决方案

Java应用程序jar文件可以由 JVM(Java虚拟机)直接执行,只要操作系统安装了JVM便可以运行作为Java应用程序的jar文件,其跨平台特性使得很多工具软件都用jar方式来部署分发。可是,很多...

# Win10/WIN11 打不开【本地组策略编辑器】解决方案

#java学不进去怎么办## Win10/WIN11 打不开【本地组策略编辑器】解决方案段子手168## 问题描述:当在 WIN + R 打开【运行】输入:gpedit.msc 打开【本地组策略编辑器...

《我的世界》Win10没反应打不开怎么办?

《我的世界》中有很多使用Win10或者Win8系统的玩家们打不开游戏,该如何解决?这里带来玩家“SuiYa”分享的解决方法,有相同问题的玩家们可以进行参考。解决办法:PS:未必对所有玩家有效。首先打开...

Java的finally真的保险吗?程序员必知的五个失效场景

你以为的"保险柜",也有打不开的时候程序员圈子里流传着一句话:“finally是代码的保险柜,永远会执行”。但真相是——这个"保险柜"的钥匙,有时候会被偷偷藏起来。举个:你点了外卖,外卖小哥说"一定送...

学习Java最应该关注的20个网站,建议收藏

学习Java是一个漫长的过程,除了学习课程之外,我们可以多关注一些网站,包括项目平台、开发者社区、教程分享网站等等。这些网站和上面的资源,可以帮助我们在学习的过程中,更好的吸收和消化所学知识。推荐收藏...

小白如何系统的学习Java?内行人给出这样的建议

随着现代经济济和科技的发展,中国Java编程开发语言行业已经步入了一个高速发展的时代。大家有目共睹了Java编程语言发展的迅猛,每年的Java人才缺口人数都高达百万以上。在我们的工作中、学习中、生活中...