partReport.py 139 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411511611711811912012112212312412512612712812913013113213313413513613713813914014114214314414514614714814915015115215315415515615715815916016116216316416516616716816917017117217317417517617717817918018118218318418518618718818919019119219319419519619719819920020120220320420520620720820921021121221321421521621721821922022122222322422522622722822923023123223323423523623723823924024124224324424524624724824925025125225325425525625725825926026126226326426526626726826927027127227327427527627727827928028128228328428528628728828929029129229329429529629729829930030130230330430530630730830931031131231331431531631731831932032132232332432532632732832933033133233333433533633733833934034134234334434534634734834935035135235335435535635735835936036136236336436536636736836937037137237337437537637737837938038138238338438538638738838939039139239339439539639739839940040140240340440540640740840941041141241341441541641741841942042142242342442542642742842943043143243343443543643743843944044144244344444544644744844945045145245345445545645745845946046146246346446546646746846947047147247347447547647747847948048148248348448548648748848949049149249349449549649749849950050150250350450550650750850951051151251351451551651751851952052152252352452552652752852953053153253353453553653753853954054154254354454554654754854955055155255355455555655755855956056156256356456556656756856957057157257357457557657757857958058158258358458558658758858959059159259359459559659759859960060160260360460560660760860961061161261361461561661761861962062162262362462562662762862963063163263363463563663763863964064164264364464564664764864965065165265365465565665765865966066166266366466566666766866967067167267367467567667767867968068168268368468568668768868969069169269369469569669769869970070170270370470570670770870971071171271371471571671771871972072172272372472572672772872973073173273373473573673773873974074174274374474574674774874975075175275375475575675775875976076176276376476576676776876977077177277377477577677777877978078178278378478578678778878979079179279379479579679779879980080180280380480580680780880981081181281381481581681781881982082182282382482582682782882983083183283383483583683783883984084184284384484584684784884985085185285385485585685785885986086186286386486586686786886987087187287387487587687787887988088188288388488588688788888989089189289389489589689789889990090190290390490590690790890991091191291391491591691791891992092192292392492592692792892993093193293393493593693793893994094194294394494594694794894995095195295395495595695795895996096196296396496596696796896997097197297397497597697797897998098198298398498598698798898999099199299399499599699799899910001001100210031004100510061007100810091010101110121013101410151016101710181019102010211022102310241025102610271028102910301031103210331034103510361037103810391040104110421043104410451046104710481049105010511052105310541055105610571058105910601061106210631064106510661067106810691070107110721073107410751076107710781079108010811082108310841085108610871088108910901091109210931094109510961097109810991100110111021103110411051106110711081109111011111112111311141115111611171118111911201121112211231124112511261127112811291130113111321133113411351136113711381139114011411142114311441145114611471148114911501151115211531154115511561157115811591160116111621163116411651166116711681169117011711172117311741175117611771178117911801181118211831184118511861187118811891190119111921193119411951196119711981199120012011202120312041205120612071208120912101211121212131214121512161217121812191220122112221223122412251226122712281229123012311232123312341235123612371238123912401241124212431244124512461247124812491250125112521253125412551256125712581259126012611262126312641265126612671268126912701271127212731274127512761277127812791280128112821283128412851286128712881289129012911292129312941295129612971298129913001301130213031304130513061307130813091310131113121313131413151316131713181319132013211322132313241325132613271328132913301331133213331334133513361337133813391340134113421343134413451346134713481349135013511352135313541355135613571358135913601361136213631364136513661367136813691370137113721373137413751376137713781379138013811382138313841385138613871388138913901391139213931394139513961397139813991400140114021403140414051406140714081409141014111412141314141415141614171418141914201421142214231424142514261427142814291430143114321433143414351436143714381439144014411442144314441445144614471448144914501451145214531454145514561457145814591460146114621463146414651466146714681469147014711472147314741475147614771478147914801481148214831484148514861487148814891490149114921493149414951496149714981499150015011502150315041505150615071508150915101511151215131514151515161517151815191520152115221523152415251526152715281529153015311532153315341535153615371538153915401541154215431544154515461547154815491550155115521553155415551556155715581559156015611562156315641565156615671568156915701571157215731574157515761577157815791580158115821583158415851586158715881589159015911592159315941595159615971598159916001601160216031604160516061607160816091610161116121613161416151616161716181619162016211622162316241625162616271628162916301631163216331634163516361637163816391640164116421643164416451646164716481649165016511652165316541655165616571658165916601661166216631664166516661667166816691670167116721673167416751676167716781679168016811682168316841685168616871688168916901691169216931694169516961697169816991700170117021703170417051706170717081709171017111712171317141715171617171718171917201721172217231724172517261727172817291730173117321733173417351736173717381739174017411742174317441745174617471748174917501751175217531754175517561757175817591760176117621763176417651766176717681769177017711772177317741775177617771778177917801781178217831784178517861787178817891790179117921793179417951796179717981799180018011802180318041805180618071808180918101811181218131814181518161817181818191820182118221823182418251826182718281829183018311832183318341835183618371838183918401841184218431844184518461847184818491850185118521853185418551856185718581859186018611862186318641865186618671868186918701871187218731874187518761877187818791880188118821883188418851886188718881889189018911892189318941895189618971898189919001901190219031904190519061907190819091910191119121913191419151916191719181919192019211922192319241925192619271928192919301931193219331934193519361937193819391940194119421943194419451946194719481949195019511952195319541955195619571958195919601961196219631964196519661967196819691970197119721973197419751976197719781979198019811982198319841985198619871988198919901991199219931994199519961997199819992000200120022003200420052006200720082009201020112012201320142015201620172018201920202021202220232024202520262027202820292030203120322033203420352036203720382039204020412042204320442045204620472048204920502051205220532054205520562057205820592060206120622063206420652066206720682069207020712072207320742075207620772078207920802081208220832084208520862087208820892090209120922093209420952096209720982099210021012102210321042105210621072108210921102111211221132114211521162117211821192120212121222123212421252126212721282129213021312132213321342135213621372138213921402141214221432144214521462147214821492150215121522153215421552156215721582159216021612162216321642165216621672168216921702171217221732174217521762177217821792180218121822183218421852186218721882189219021912192219321942195219621972198219922002201220222032204220522062207220822092210221122122213221422152216221722182219222022212222222322242225222622272228222922302231223222332234223522362237223822392240224122422243224422452246224722482249225022512252225322542255225622572258225922602261226222632264226522662267226822692270227122722273227422752276227722782279228022812282228322842285228622872288228922902291229222932294229522962297229822992300230123022303230423052306230723082309231023112312231323142315231623172318231923202321232223232324232523262327232823292330233123322333233423352336233723382339234023412342234323442345234623472348234923502351235223532354235523562357235823592360236123622363236423652366236723682369237023712372237323742375
  1. import pandas as pd
  2. import numpy as np
  3. import time
  4. import os
  5. from docx.shared import Inches
  6. from docx.shared import Pt, RGBColor
  7. from docx import Document
  8. from docx.enum.table import WD_TABLE_ALIGNMENT, WD_CELL_VERTICAL_ALIGNMENT
  9. from docx.oxml.ns import qn
  10. from docx.enum.text import WD_ALIGN_PARAGRAPH
  11. from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
  12. import report
  13. from datetime import datetime
  14. # import chinese_converter # 需要安装这个库来转换数字为中文大写
  15. import cn2an
  16. # 频度信息表生成
  17. def makeInfoTable(data, doc):
  18. rows = (int(len(data.columns) / 6) + 1)
  19. columnsList = np.arange(0, rows * 6, 6)
  20. dataList = []
  21. for i in columnsList:
  22. res = data.iloc[:, i:i + 6]
  23. res = res.reset_index()
  24. dataList.append(res)
  25. table_f_2 = doc.add_table(rows=rows * 6, cols=7, style='Light Shading Accent 1')
  26. for i, row in enumerate(table_f_2.rows):
  27. for j, cell in enumerate(row.cells):
  28. # 获取单元格中的段落对象
  29. paragraph = cell.paragraphs[0]
  30. if i == columnsList[0]:
  31. # 第一行 显示前6个指标的列名
  32. if len(dataList[0].columns) > j:
  33. r = paragraph.add_run(dataList[0].columns[j])
  34. r.font.bold = True
  35. r.font.size = Pt(10.5)
  36. r.font.name = 'Times New Roman'
  37. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  38. else:
  39. paragraph.add_run('')
  40. elif len(columnsList) > 1 and i > columnsList[0] and i < columnsList[1]:
  41. if len(dataList[0].columns) > j:
  42. r = paragraph.add_run(str(dataList[0].iloc[i - 1, j]))
  43. r.font.size = Pt(10.5)
  44. r.font.name = 'Times New Roman'
  45. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  46. else:
  47. paragraph.add_run('')
  48. elif i == columnsList[1]:
  49. # 第6行 显示前6个指 标的列名
  50. if len(dataList[1].columns) > j:
  51. r = paragraph.add_run(dataList[1].columns[j])
  52. r.font.bold = True
  53. r.font.size = Pt(10.5)
  54. r.font.name = 'Times New Roman'
  55. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  56. else:
  57. paragraph.add_run('')
  58. elif len(columnsList) > 2 and i > columnsList[1] and i < columnsList[2]:
  59. if len(dataList[1].columns) > j:
  60. r = paragraph.add_run(str(dataList[1].iloc[i - 7, j]))
  61. r.font.size = Pt(10.5)
  62. r.font.name = 'Times New Roman'
  63. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  64. else:
  65. paragraph.add_run('')
  66. elif i == columnsList[2]:
  67. # 第6*2行 显示前6个指 标的列名
  68. if len(dataList[2].columns) > j:
  69. r = paragraph.add_run(dataList[2].columns[j])
  70. r.font.bold = True
  71. r.font.size = Pt(10.5)
  72. r.font.name = 'Times New Roman'
  73. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  74. else:
  75. paragraph.add_run('')
  76. elif len(columnsList) > 3 and i > columnsList[2] and i < columnsList[3]:
  77. if len(dataList[2].columns) > j:
  78. r = paragraph.add_run(str(dataList[2].iloc[i - 13, j]))
  79. r.font.size = Pt(10.5)
  80. r.font.name = 'Times New Roman'
  81. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  82. else:
  83. paragraph.add_run('')
  84. elif i == columnsList[3]:
  85. # 第6*3行 显示前6个指 标的列名
  86. if len(dataList[3].columns) > j:
  87. r = paragraph.add_run(dataList[3].columns[j])
  88. r.font.bold = True
  89. r.font.size = Pt(10.5)
  90. r.font.name = 'Times New Roman'
  91. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  92. else:
  93. paragraph.add_run('')
  94. elif len(columnsList) > 4 and i > columnsList[3] and i < columnsList[4]:
  95. if len(dataList[3].columns) > j:
  96. r = paragraph.add_run(str(dataList[3].iloc[i - 19, j]))
  97. r.font.size = Pt(10.5)
  98. r.font.name = 'Times New Roman'
  99. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  100. else:
  101. paragraph.add_run('')
  102. elif i == columnsList[4]:
  103. # 第6*4行 显示前6个指 标的列名
  104. if len(dataList[4].columns) > j:
  105. r = paragraph.add_run(dataList[4].columns[j])
  106. r.font.bold = True
  107. r.font.size = Pt(10.5)
  108. r.font.name = 'Times New Roman'
  109. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  110. else:
  111. paragraph.add_run('')
  112. elif len(columnsList) > 5 and i > columnsList[4] and i < columnsList[5]:
  113. if len(dataList[4].columns) > j:
  114. r = paragraph.add_run(str(dataList[4].iloc[i - 25, j]))
  115. r.font.size = Pt(10.5)
  116. r.font.name = 'Times New Roman'
  117. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  118. else:
  119. paragraph.add_run('')
  120. elif i == columnsList[5]:
  121. # 第6*5行 显示前6个指 标的列名
  122. if len(dataList[5].columns) > j:
  123. r = paragraph.add_run(dataList[5].columns[j])
  124. r.font.bold = True
  125. r.font.size = Pt(10.5)
  126. r.font.name = 'Times New Roman'
  127. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  128. else:
  129. paragraph.add_run('')
  130. elif len(columnsList) > 6 and i > columnsList[5] and i < columnsList[6]:
  131. if len(dataList[5].columns) > j:
  132. r = paragraph.add_run(str(dataList[5].iloc[i - 31, j]))
  133. r.font.size = Pt(10.5)
  134. r.font.name = 'Times New Roman'
  135. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  136. else:
  137. paragraph.add_run('')
  138. elif i == columnsList[6]:
  139. # 第6*6行 显示前6个指 标的列名
  140. if len(dataList[6].columns) > j:
  141. r = paragraph.add_run(dataList[6].columns[j])
  142. r.font.bold = True
  143. r.font.size = Pt(10.5)
  144. r.font.name = 'Times New Roman'
  145. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  146. else:
  147. paragraph.add_run('')
  148. elif len(columnsList) > 7 and i > columnsList[6] and i < columnsList[7]:
  149. if len(dataList[6].columns) > j:
  150. r = paragraph.add_run(str(dataList[6].iloc[i - 37, j]))
  151. r.font.size = Pt(10.5)
  152. r.font.name = 'Times New Roman'
  153. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  154. else:
  155. paragraph.add_run('')
  156. elif i == columnsList[7]:
  157. # 第6*7行 显示前6个指 标的列名
  158. if len(dataList[7].columns) > j:
  159. r = paragraph.add_run(dataList[7].columns[j])
  160. r.font.bold = True
  161. r.font.size = Pt(10.5)
  162. r.font.name = 'Times New Roman'
  163. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  164. else:
  165. paragraph.add_run('')
  166. elif len(columnsList) >= 8 and i > columnsList[7] and i < columnsList[8]:
  167. if len(dataList[7].columns) > j:
  168. r = paragraph.add_run(str(dataList[7].iloc[i - 43, j]))
  169. r.font.size = Pt(10.5)
  170. r.font.name = 'Times New Roman'
  171. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  172. else:
  173. paragraph.add_run('')
  174. elif i == columnsList[8]:
  175. if len(dataList[8].columns) > j:
  176. # 第6*8行 显示前6个指 标的列名
  177. r = paragraph.add_run(dataList[8].columns[j])
  178. r.font.bold = True
  179. r.font.size = Pt(10.5)
  180. r.font.name = 'Times New Roman'
  181. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  182. else:
  183. paragraph.add_run('')
  184. elif len(columnsList) >= 9 and i > columnsList[8] and i < columnsList[9]:
  185. if len(dataList[8].columns) > j:
  186. r = paragraph.add_run(str(dataList[8].iloc[i - 49, j]))
  187. r.font.size = Pt(10.5)
  188. r.font.name = 'Times New Roman'
  189. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  190. else:
  191. paragraph.add_run('')
  192. elif i == columnsList[9]:
  193. # 第6*9行 显示前6个指 标的列名
  194. if len(dataList[9].columns) > j:
  195. r = paragraph.add_run(dataList[9].columns[j])
  196. r.font.bold = True
  197. r.font.size = Pt(10.5)
  198. r.font.name = 'Times New Roman'
  199. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  200. else:
  201. paragraph.add_run('')
  202. elif len(columnsList) >= 10 and i > columnsList[9] and i <= 60:
  203. if len(dataList[9].columns) > j:
  204. r = paragraph.add_run(str(dataList[9].iloc[i - 55, j]))
  205. r.font.size = Pt(10.5)
  206. r.font.name = 'Times New Roman'
  207. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  208. else:
  209. paragraph.add_run('')
  210. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  211. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  212. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  213. # 生成子报告: 物理指标 常规养分指标 一般化学性指标 重金属指标
  214. indexClassificationList = {
  215. '物理指标': ['pH', '土壤质地', '土壤容重1(g/cm³)', '土壤容重2(g/cm³)', '土壤容重3(g/cm³)', '土壤容重4(g/cm³)', '土壤容重平均值(g/cm³)',
  216. '2~0.2mm颗粒含量', '0.2~0.02mm颗粒含量', '0.02~0.002mm颗粒含量', '0.002mm以下颗粒含量', '水稳>5mm(%)', '水稳3mm~5mm(%)',
  217. '水稳2mm~3mm(%)', '水稳1mm~2mm(%)', '水稳0.5mm~1mm(%)', '水稳0.25mm~0.5mm(%)', '水稳性大团聚体总和(%)', '洗失量(吸管法需填)', '风干试样含水量(分析基)'],
  218. '常规养分指标': ['pH','有机质', '全氮', '全磷', '全钾', '有效磷', '速效钾', '有效硫', '有效硼', '有效铁', '有效锰', '有效铜', '有效锌', '有效钼', '有效硅', '缓效钾'],
  219. '一般化学性指标': ['pH','阳离子交换量', '交换性盐基总量', '交换性钙', '交换性镁', '交换性钠', '交换性钾', '全盐量', '电导率',
  220. '水溶性Na⁺含量', '水溶性K⁺含量', '水溶性Ca²⁺含量', '水溶性Mg²⁺含量', '水溶性Cl⁻含量', '水溶性CO₃²⁻含量','水溶性HCO₃⁻含量',
  221. '水溶性SO₄²⁻含量', '离子总量', '碳酸钙'],
  222. '重金属指标': ['pH', '总汞', '总砷', '总铅', '总镉', '总铬', '总镍']
  223. }
  224. # 生成物理指标审核报告
  225. def getphysicsReport(originData,data,type, changeFileUrl, saveFileUrl, check_1_data,
  226. check_3_data,
  227. check_5_data ,
  228. check_8_data, # 样品编号替换为编号
  229. check_10_data,
  230. check_12_data,
  231. check_14_data ):
  232. """
  233. :param type: 指标类型
  234. :param changeFileUrl: 选择的数据文件路径
  235. :param saveFileUrl: 保存的文件路径
  236. :param check_1_data: 土壤容重数据
  237. :param check_3_data: 水稳审核数据
  238. :param check_5_data: 盐离子数据
  239. :param check_8_data: 水溶性离子数据
  240. :param check_10_data: 有机质及氮磷钾数据
  241. :param check_12_data: 有效养分数据
  242. :param check_14_data: 重金属数据
  243. :return:
  244. """
  245. # 生成报告
  246. name = os.path.basename(changeFileUrl)
  247. n = name.split('.')
  248. areaName = n[0].replace('数据', '')
  249. # 生成一个新的文件夹用于存放审核报告相关的数据
  250. nowTime = time.strftime("%Y-%m-%d %H时%M分%S秒", time.localtime())
  251. dir_name = f'{areaName}-{type}数据审核报告'
  252. mkdir_path = saveFileUrl + '/' + dir_name + nowTime
  253. if not os.path.exists(mkdir_path):
  254. os.mkdir(mkdir_path)
  255. # 获取相应指标数据
  256. physicsData = data[indexClassificationList[type]]
  257. physicsDataNum = originData[indexClassificationList[type]]
  258. report.getFrequencyImage(physicsData, mkdir_path)
  259. physicsData['序号'] = data['序号']
  260. physicsData['原样品编号'] = data['原样品编号']
  261. physicsData['样品编号'] = data['样品编号']
  262. physicsData['地理位置'] = data['地理位置']
  263. physicsData['母质'] = data['母质']
  264. physicsData['土壤类型'] = data['土壤类型']
  265. physicsData['土地利用类型'] = data['土地利用类型']
  266. physicsData['土壤质地'] = data['土壤质地']
  267. physicsDataNum['序号'] = originData['序号']
  268. physicsDataNum['原样品编号'] = originData['原样品编号']
  269. physicsDataNum['样品编号'] = originData['样品编号']
  270. physicsDataNum['地理位置'] = originData['地理位置']
  271. physicsDataNum['母质'] = originData['母质']
  272. physicsDataNum['土壤类型'] = originData['土壤类型']
  273. physicsDataNum['土地利用类型'] = originData['土地利用类型']
  274. physicsDataNum['土壤质地'] = originData['土壤质地']
  275. physicsDataNum['原样品编号'] = originData['原样品编号'].astype(str)
  276. # 生成相应审核报告
  277. # 根据选择的路径读取数据
  278. physicsData['原样品编号'] = physicsData['原样品编号'].astype(str)
  279. # todo 有数据后这里去掉注释
  280. # checkData = pd.read_excel(changeFileUrl, sheet_name='检测方法')
  281. # 上面这个地址,可以传递给函数中,用于保存表格和图片
  282. # 调用函数 开始生成报告相关内容
  283. # 表1相关数据
  284. typeData = report.getSimpleNum(physicsData)
  285. lenNum_1 = len(typeData['sData'])
  286. lenNum_1_f = len(typeData['allData'])
  287. table_1_data = pd.DataFrame({
  288. '类型': typeData['sData'].index,
  289. '数量': typeData['sData'],
  290. '合计': [typeData['sData'].sum() for _ in range(lenNum_1)]
  291. })
  292. # 表2数据
  293. table_2_data = report.getDataComplete(physicsData)
  294. table_2_data = table_2_data.reset_index()
  295. table_2_data.columns = ['指标名称', '实测数量', '应测数量']
  296. # 表3数据
  297. # table_3_data = report.checkMethod(checkData, mkdir_path)
  298. # 数据修约 表4
  299. report.getNum(physicsDataNum, mkdir_path)
  300. # 数据填报项审核 表5
  301. report.dataReportResult(physicsData, mkdir_path)
  302. # 表6数据 土壤质地类型不一致
  303. # middData = physicsData[['原样品编号', '样品编号']].astype(str)
  304. # middData['编号'] = middData['原样品编号']
  305. # del middData['原样品编号']
  306. # check_1_data = pd.merge(check_1_data, middData, how='left', on='编号')
  307. check_1_data = check_1_data.replace(np.nan, '')
  308. typeNotSame = check_1_data[check_1_data['土壤质地'] != check_1_data['土壤质地(判断)']]
  309. table_6_data = typeNotSame[['编号', '样品编号', '土壤质地', '土壤质地(判断)']]
  310. allNeedData = pd.DataFrame({})
  311. allNeedData['原样品编号'] = check_1_data['编号']
  312. getSimpleDataNumber = pd.merge(allNeedData, physicsData[['原样品编号', '样品编号']], how='left', on="原样品编号")
  313. allNeedData['样品编号'] = getSimpleDataNumber['样品编号']
  314. allNeedData['土地利用类型'] = check_1_data['土地利用类型']
  315. allNeedData['审核结果'] = check_1_data['审核结果'] + check_3_data['审核结果']
  316. allNeedData['外业'] = ['' for _ in range(len(check_1_data))]
  317. table_7_data = allNeedData[allNeedData['审核结果'] != '']
  318. del table_7_data['审核结果']
  319. # 写进表格
  320. with pd.ExcelWriter(f'{mkdir_path}/超阈值样品统计表.xlsx', engine='openpyxl') as writer:
  321. table_7_data.to_excel(writer, index=False, sheet_name='超阈值数据')
  322. # 表8数据
  323. table_8_data = report.getPHData(physicsData, mkdir_path)
  324. # 表13 所有存疑数据
  325. with pd.ExcelWriter(f'{mkdir_path}/数据审核过程存疑数据一览表.xlsx', engine='openpyxl') as writer:
  326. allNeedData[allNeedData['审核结果'] != ''].to_excel(writer, index=False, sheet_name='存疑数据')
  327. # 附表: 频度分析图
  328. # report.getFrequencyImage(physicsData, mkdir_path)
  329. table_f_2_data = report.getFrequencyInformation(data, mkdir_path)
  330. # 新建一个文档
  331. doc = Document()
  332. # 添加标题
  333. doc.add_heading(f"{areaName}第三次全国土壤普查物理指标检测数据审核报告", level=0)
  334. # 在文档中添加封面段落
  335. fm = doc.add_paragraph()
  336. fm = doc.add_paragraph()
  337. fm = doc.add_paragraph()
  338. fm = doc.add_paragraph()
  339. fm = doc.add_paragraph()
  340. # 插入图片,设置宽度为6英寸(可根据需求调整)
  341. run = fm.add_run()
  342. run.add_picture('img/第三次全国土壤普查img.png', width=Inches(2.26))
  343. fm.alignment = WD_TABLE_ALIGNMENT.CENTER
  344. # 在文档中添加封面段落
  345. fm = doc.add_paragraph()
  346. fm = doc.add_paragraph()
  347. fm = doc.add_paragraph()
  348. fm = doc.add_paragraph()
  349. fm = doc.add_paragraph()
  350. fm = doc.add_paragraph()
  351. # 获取当前日期
  352. current_date = datetime.now()
  353. # 将年份和月份转换为中文大写数字
  354. year = int(current_date.strftime("%Y")) # 转换为整数
  355. month = int(current_date.strftime("%m")) # 转换为整数
  356. # 使用 cn2an 将数字转换为中文大写
  357. year_chinese = number_to_chinese_year(year) # 年份转换
  358. month_chinese = cn2an.an2cn(month) # 月份转换
  359. current_date_formatted = f"{year_chinese}年{month_chinese}月"
  360. # 组合动态文本
  361. dynamic_text = f"安徽农业大学资源与环境学院\n{current_date_formatted}"
  362. # 添加文字并居中
  363. text_paragraph = doc.add_paragraph()
  364. text_run = text_paragraph.add_run(dynamic_text)
  365. text_run.font.name = "宋体"
  366. text_run.font.size = Pt(18)
  367. text_run.bold = True # 设置字体加粗
  368. text_paragraph.alignment = 1 # 1 表示居中对齐
  369. # 正确插入分页符
  370. doc.add_page_break()
  371. heading = doc.add_heading('总体概述', level=1)
  372. heading.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  373. # 第一段
  374. long_text1 = f"""
  375. {areaName}第三次全国土壤普查县级数据审核报告主要通过收集和整理相关数据,并对其进行内业检测数据的完整性、规范性和合理性进行审核,形成存疑样点清单及存疑样点结果判定,最终编制完成数据审核报告,同时提交( )对相关指标进行整改复测。报告整理了( )个表层样品数据(含平行样、质控样)、( )个水稳性大团聚体样品数据(含平行样)、( )个剖面样品数据(含平行样、质控样),共( )次样品检测结果分析情况。相关结果分别按照物理性指标检测数据、一般化学指标检测数据、常规养分指标检测数据和重金属指标检测数据形成四份报告。本报告为表层样常规养分指标检测数据审核报告。
  376. """
  377. para0 = doc.add_paragraph(long_text1)
  378. run0 = para0.runs[0] # 获取段落中的第一个run对象
  379. run0.font.name = '宋体' # 设置字体为宋体
  380. run0.font.size = Pt(11) # 设置字号为11磅
  381. # 设置段落的行间距为1.5倍
  382. para_format = para0.paragraph_format
  383. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  384. # 添加一级标题
  385. doc.add_heading('一、数据完整性审核', level=1)
  386. # 第二段
  387. long_text2 = """
  388. 外业信息调查采样环节:采用电子围栏和外业调查采样APP,对采样位置和填报信息进行管理,确保外业调查信息填报完整。
  389. 样品检测数据上报环节:通过土壤普查工作平台对上报数据的完整性进行筛查。( )第三次土壤普查相关指标检测数据由( )提供,数据均已通过省级质控实验室和县级土壤普查办审核;相关土壤指标历史数据则由( )第三次土壤普查办公室提供。根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》要求,统计各土地利用类型的样品数量,并按照耕地园地土壤样品(表层/剖面)、林地草地土壤样品(表层/剖面)以及水稳定性大团聚体样品(见表1)进行分类,编制了指标名称与实际检测样品数量统计表(见表2),其中水溶性盐分总量大于( ),增加检测了八大离子(该指标在化学指标检测数据审核报告内)。
  390. """
  391. para = doc.add_paragraph(long_text2)
  392. run1 = para.runs[0]
  393. run1.font.name = '宋体' # 设置字体为宋体
  394. run1.font.size = Pt(11) # 设置字号为11磅
  395. # 设置段落的行间距为1.5倍
  396. para_format = para.paragraph_format
  397. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  398. doc.add_heading('1、土地利用类型与检测指标符合性审核', level=2)
  399. # 插入表格1
  400. paragraph_1 = doc.add_paragraph()
  401. paragraph_1.add_run(f"表1:{areaName}三普样品数量统计表(表层)").bold = True
  402. # 设置居中
  403. paragraph_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  404. table_1 = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  405. table_1.alignment = WD_TABLE_ALIGNMENT.CENTER
  406. # 遍历表格 插入数据
  407. # 遍历表格的所有单元格,并填充内容
  408. for i, row in enumerate(table_1.rows):
  409. for j, cell in enumerate(row.cells):
  410. # 获取单元格中的段落对象
  411. paragraph = cell.paragraphs[0]
  412. if i == 0:
  413. r = paragraph.add_run(str(table_1_data.columns[j]))
  414. r.font.bold = True
  415. else:
  416. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  417. r.font.size = Pt(10.5)
  418. r.font.name = 'Times New Roman'
  419. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  420. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  421. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  422. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  423. # 合并单元格 合并第3列的第二行和第三行
  424. if lenNum_1 > 1:
  425. table_1.cell(2, 2).text = ''
  426. table_1.cell(1, 2).merge(table_1.cell(2, 2))
  427. ############test##############
  428. doc.add_heading('2、指标名称与实际检测样品数量完整性审核', level=2)
  429. # 插入表格2
  430. paragraph_2 = doc.add_paragraph()
  431. paragraph_2.add_run(f'表2:{areaName}指标名称与实际检测样品数量统计表').bold = True
  432. table_2 = doc.add_table(rows=len(table_2_data) + 1, cols=3, style='Light Shading Accent 1')
  433. paragraph_2.alignment = WD_ALIGN_PARAGRAPH.CENTER
  434. table_2.alignment = WD_TABLE_ALIGNMENT.CENTER
  435. for i, row in enumerate(table_2.rows):
  436. for j, cell in enumerate(row.cells):
  437. # 获取单元格中的段落对象
  438. paragraph = cell.paragraphs[0]
  439. if i == 0:
  440. r = paragraph.add_run(str(table_2_data.columns[j]))
  441. r.font.bold = True
  442. else:
  443. r = paragraph.add_run(str(table_2_data.iloc[i - 1, j]))
  444. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  445. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  446. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  447. r.font.size = Pt(10.5)
  448. r.font.name = 'Times New Roman'
  449. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  450. doc.add_heading('二、数据规范性审核', level=1)
  451. long_text3 = """
  452. 按照《第三次全国土壤普查暂行土壤分类系统 (试行)》、《第三次全国土壤普查工作底图制作与采样点布设技术规范》、《第三次全国土壤普查土壤类型图编制技术规范》《第三次全国土壤普查土壤样品制备与检测技术规范》等规范统一标准和表现形式,土地利用方式按照第三次国土调查土地利用信息统一,种植制度按照农业区划信息进行统一。三普工作平台同时内置指标量纲、数字修约和允差等,控制数据规范性。
  453. 根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》,对检测指标对应的检测方法与相关标准或规范进行审核,得到检测方法审核、数值修约审核、数据填报项审核结果,未检出项填报以检出限的一半上报并加注*号。根据土壤普查教材中机械组成分类参考表,并进行宁国土壤质地填报审核结果表(见表6)。
  454. """
  455. para = doc.add_paragraph(long_text3)
  456. run1 = para.runs[0]
  457. run1.font.name = '宋体' # 设置字体为宋体
  458. run1.font.size = Pt(11) # 设置字号为11磅
  459. doc.add_heading('1、数据填报规范性审核', level=2)
  460. doc.add_heading('1、数据填报规范性审核', level=2)
  461. # 插入表3
  462. paragraph_3 = doc.add_paragraph()
  463. paragraph_3.add_run(f'表3:{areaName}土壤检测数据检测方法填报审核结果表').bold = True
  464. # table_3 = doc.add_table(rows=2, cols=2)
  465. paragraph_3.alignment = WD_ALIGN_PARAGRAPH.CENTER
  466. # table_3.alignment = WD_TABLE_ALIGNMENT.CENTER
  467. # 写入数据 这里数据写不下 嵌入链接
  468. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:检测方法审核结果.xlsx', level=4)
  469. doc.add_heading('2、数值修约规范性审核', level=2)
  470. # 插入表4
  471. paragraph_4 = doc.add_paragraph()
  472. paragraph_4.add_run(f'表4:{areaName}土壤检测数据数值修约结果表').bold = True
  473. # table_4 = doc.add_table(rows=2, cols=2)
  474. paragraph_4.alignment = WD_ALIGN_PARAGRAPH.CENTER
  475. # table_4.alignment = WD_TABLE_ALIGNMENT.CENTER
  476. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数值修约审核.xlsx', level=4)
  477. # 填入数据 这里数据也放不下 嵌入链接
  478. doc.add_heading('3、数据未检出的填报规范性审核', level=2)
  479. # 插入表5
  480. paragraph_5 = doc.add_paragraph()
  481. paragraph_5.add_run(f'表5:{areaName}土壤检测数据未检出项填报审核结果表').bold = True
  482. # table_5 = doc.add_table(rows=2, cols=2)
  483. paragraph_5.alignment = WD_ALIGN_PARAGRAPH.CENTER
  484. # table_5.alignment = WD_TABLE_ALIGNMENT.CENTER
  485. # 写入数据 这里数据也放不下 嵌入链接
  486. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据填报项审核结果.xlsx', level=4)
  487. doc.add_heading('4、土壤质地填报规范性审核', level=2)
  488. # 插入表6
  489. paragraph_6 = doc.add_paragraph()
  490. paragraph_6.add_run(f'表6:{areaName}土壤质地填报审核结果表').bold = True
  491. table_6 = doc.add_table(rows=len(table_6_data) + 1, cols=4, style='Light Shading Accent 1')
  492. paragraph_6.alignment = WD_ALIGN_PARAGRAPH.CENTER
  493. table_6.alignment = WD_TABLE_ALIGNMENT.CENTER
  494. # 提取结果表中数据
  495. # 写入数据 土壤质地类型不一致的数据提取出来
  496. for i, row in enumerate(table_6.rows):
  497. for j, cell in enumerate(row.cells):
  498. # 获取单元格中的段落对象
  499. paragraph = cell.paragraphs[0]
  500. if i == 0:
  501. r = paragraph.add_run(str(table_6_data.columns[j]))
  502. r.font.bold = True
  503. else:
  504. r = paragraph.add_run(str(table_6_data.iloc[i - 1, j]))
  505. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  506. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  507. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  508. r.font.size = Pt(10.5)
  509. r.font.name = 'Times New Roman'
  510. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  511. doc.add_heading('三、数据合理性审核', level=1)
  512. long_text4 = """
  513. 明确数据审核原则,结合外业调查采样,获取的成土环境、土壤利用现状等信息对结果进行综合评价。通过阈值分析、关联分析、逻辑分析等方法对数据准确性进行判断。
  514. 阈值法(国家和省级数据阈值):结合区域历史数据建立阈值,平台利用阈值法(国家和省级数据值)自动对检测数据进行初步审核,并对超出阈值范围数据做出警示标识,专家或专业技术人员结合区域实际、专家经验判定异常值并对异常数据进行驳回。超出阈值颜色标注。
  515. 红色: 超出国家阈值,维持试点期间的标红。
  516. 黄色: 省级阈值在国家阈值范围内的,数据超出省级阈值标黄。
  517. 紫色: 省级阈值超出国家阈值的,数据超出省级阈值标成紫色(注,此种情况超国家阈值的红色服从紫色,仅标紫色)
  518. 极值法: 常用的统计量是均值、标准差、最大值、最小值、分位数等,用来判断是否超出了合理的极值范围。根据相关指标历年数据与指标最大值、最小值、平均数、中位数和极差进行审查,结合相关外业情况。
  519. 关联分析方法: 存在量化关系的指标,通过设定组合筛选异常值,如碳氮比等关联分析。
  520. 指标综合分析:根据指标相互之间的关系,如有效磷在全磷中的占比、全钾与速效钾缓效钾之和的关系等。有机质、全磷、有效磷、全钾等数据异常; 全氮和有机质之间关系不合理; 速效钾含量远大于缓效钾,盐基总量远大于阳离子交换量; 部分样品阳离子交换量和交换性盐基总量测定结果偏低; 水溶盐离子总量与全盐量的相对偏差已远超过方法规定的允差范围; 容重检测偏差比较大;水稳性大团聚体土壤于燥结块,影响测定结果、重金属按照风险筛选值和风险管控值等问题。
  521. 数据质量溯源:异常数据溯源,可能是内业测试化验环节问题,也有可能是外业调查采样问题,要结合数据检测和异常复检情况具体判断。
  522. """
  523. para = doc.add_paragraph(long_text4)
  524. run1 = para.runs[0]
  525. run1.font.name = '宋体' # 设置字体为宋体
  526. run1.font.size = Pt(11) # 设置字号为11磅
  527. doc.add_heading('1、阈值法审核', level=2)
  528. # 插入表格
  529. paragraph_7 = doc.add_paragraph()
  530. paragraph_7.add_run(f'表7:{areaName}土壤检测数据超阈值样品统计表').bold = True
  531. # table_7 = doc.add_table(rows=2, cols=2)
  532. # paragraph_7.alignment = WD_ALIGN_PARAGRAPH.CENTER
  533. # table_7.alignment = WD_TABLE_ALIGNMENT.CENTER
  534. # 写入数据 点击查看数据 这里也不一定写的下 最好是嵌入链接
  535. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:超阈值样品统计表.xlsx', level=4)
  536. # todo 合并所有数据 审核结果不为空的数据 写入表格保存到指定文件夹
  537. doc.add_heading('2、极值法审核', level=2)
  538. doc.add_heading('(1)pH', level=3)
  539. # 插入ph分布图
  540. if os.path.isfile(f'{mkdir_path}/PH值分布图.png'):
  541. doc.add_picture(f'{mkdir_path}/PH值分布图.png', width=Inches(6.0))
  542. paragraph_t_1 = doc.add_paragraph()
  543. paragraph_t_1.add_run(f'图1:pH值分布情况').bold = True
  544. paragraph_t_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  545. # 插入频度统计表
  546. paragraph_8 = doc.add_paragraph()
  547. paragraph_8.add_run('表8:pH数据统计表').bold = True
  548. table_8 = doc.add_table(rows=6, cols=2, style='Light Shading Accent 1')
  549. t_8 = table_8_data['频度分析']
  550. t_8 = t_8.reset_index()
  551. t_8.columns = ['指标', '数据']
  552. paragraph_8.alignment = WD_ALIGN_PARAGRAPH.CENTER
  553. table_8.alignment = WD_TABLE_ALIGNMENT.CENTER
  554. for i, row in enumerate(table_8.rows):
  555. for j, cell in enumerate(row.cells):
  556. # 获取单元格中的段落对象
  557. paragraph = cell.paragraphs[0]
  558. if i == 0:
  559. r = paragraph.add_run(str(t_8.columns[j]))
  560. r.font.bold = True
  561. else:
  562. r = paragraph.add_run(str(t_8.iloc[i - 1, j]))
  563. r.font.size = Pt(10.5)
  564. r.font.name = 'Times New Roman'
  565. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  566. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  567. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  568. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  569. # 插入异常数据提取表格 todo 这里数据多的话也可能写不下 最好是嵌入一下
  570. if not table_8_data['异常数据'].empty:
  571. paragraph_9 = doc.add_paragraph()
  572. paragraph_9.add_run('表9:pH异常数据统计表').bold = True
  573. table_9 = doc.add_table(rows=len(table_8_data['异常数据']) + 1, cols=6, style='Light Shading Accent 1')
  574. t_9 = table_8_data['异常数据']
  575. paragraph_9.alignment = WD_ALIGN_PARAGRAPH.CENTER
  576. table_9.alignment = WD_TABLE_ALIGNMENT.CENTER
  577. for i, row in enumerate(table_9.rows):
  578. for j, cell in enumerate(row.cells):
  579. # 获取单元格中的段落对象
  580. paragraph = cell.paragraphs[0]
  581. if i == 0:
  582. r = paragraph.add_run(str(t_9.columns[j]))
  583. r.font.bold = True
  584. else:
  585. r = paragraph.add_run(str(t_9.iloc[i - 1, j]))
  586. r.font.size = Pt(10.5)
  587. r.font.name = 'Times New Roman'
  588. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  589. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  590. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  591. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  592. doc.add_heading('四、审核存疑数据', level=1)
  593. paragraph_12 = doc.add_paragraph()
  594. paragraph_12.add_run(f'表10:数据审核过程存疑数据一览表').bold = True
  595. paragraph_12.alignment = WD_ALIGN_PARAGRAPH.CENTER
  596. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:物理指标数据审核过程存疑数据一览表.xlsx', level=4)
  597. doc.add_heading('五、附表', level=1)
  598. doc.add_heading('附表1:某区三普样品数量统计表(表层)', level=2)
  599. # 插入附表1
  600. table_1_f = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  601. table_1_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  602. # 遍历表格 插入数据
  603. # 遍历表格的所有单元格,并填充内容
  604. for i, row in enumerate(table_1_f.rows):
  605. for j, cell in enumerate(row.cells):
  606. # 获取单元格中的段落对象
  607. paragraph = cell.paragraphs[0]
  608. if i == 0:
  609. r = paragraph.add_run(str(table_1_data.columns[j]))
  610. r.font.bold = True
  611. else:
  612. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  613. r.font.size = Pt(10.5)
  614. r.font.name = 'Times New Roman'
  615. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  616. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  617. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  618. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  619. # 合并单元格 合并第3列的第二行和第三行
  620. if lenNum_1 > 1:
  621. table_1_f.cell(2, 2).text = ''
  622. table_1_f.cell(1, 2).merge(table_1_f.cell(2, 2))
  623. doc.add_heading('附表2:各指标频度分析表', level=2)
  624. # 插入表格 写入数据
  625. table_f_2_data = table_f_2_data.replace(np.nan, '')
  626. makeInfoTable(table_f_2_data, doc)
  627. # table_f_2 = doc.add_table(rows=len(table_f_2_data) + 1, cols=6, style='Light Shading Accent 1')
  628. # for i, row in enumerate(table_f_2.rows):
  629. # for j, cell in enumerate(row.cells):
  630. # # 获取单元格中的段落对象
  631. # paragraph = cell.paragraphs[0]
  632. # if i == 0:
  633. # r = paragraph.add_run(str(table_f_2_data.columns[j]))
  634. # r.font.bold = True
  635. # else:
  636. # r = paragraph.add_run(str(table_f_2_data.iloc[i - 1, j]))
  637. # r.font.size = Pt(10.5)
  638. # r.font.name = 'Times New Roman'
  639. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  640. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  641. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  642. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  643. # doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:频度分析表.xlsx', level=4)
  644. doc.add_heading('附表3:各指标频度分析图', level=2)
  645. # 插入频度信息的图形
  646. if os.path.isfile(f'{mkdir_path}/0.002mm以下颗粒含量分析图.png'):
  647. doc.add_picture(f'{mkdir_path}/0.002mm以下颗粒含量分析图.png', width=Inches(6.0))
  648. if os.path.isfile(f'{mkdir_path}/0.02~0.002mm颗粒含量分析图.png.png'):
  649. doc.add_picture(f'{mkdir_path}/0.02~0.002mm颗粒含量分析图.png', width=Inches(6.0))
  650. if os.path.isfile(f'{mkdir_path}/0.2~0.02mm颗粒含量分析图.png'):
  651. doc.add_picture(f'{mkdir_path}/0.2~0.02mm颗粒含量分析图.png', width=Inches(6.0))
  652. if os.path.isfile(f'{mkdir_path}/2~0.2mm颗粒含量分析图.png'):
  653. doc.add_picture(f'{mkdir_path}/2~0.2mm颗粒含量分析图.png', width=Inches(6.0))
  654. if os.path.isfile(f'{mkdir_path}/pH分析图.png'):
  655. doc.add_picture(f'{mkdir_path}/pH分析图.png', width=Inches(6.0))
  656. if os.path.isfile(f'{mkdir_path}/风干试样含水量(分析基)分析图.png'):
  657. doc.add_picture(f'{mkdir_path}/风干试样含水量(分析基)分析图.png', width=Inches(6.0))
  658. if os.path.isfile(f'{mkdir_path}/洗失量(吸管法需填)分析图.png'):
  659. doc.add_picture(f'{mkdir_path}/洗失量(吸管法需填)分析图.png', width=Inches(6.0))
  660. if os.path.isfile(f'{mkdir_path}/土壤容重1分析图.png'):
  661. doc.add_picture(f'{mkdir_path}/土壤容重1分析图.png', width=Inches(6.0))
  662. if os.path.isfile(f'{mkdir_path}/土壤容重2分析图.png'):
  663. doc.add_picture(f'{mkdir_path}/土壤容重2分析图.png', width=Inches(6.0))
  664. if os.path.isfile(f'{mkdir_path}/土壤容重3分析图.png'):
  665. doc.add_picture(f'{mkdir_path}/土壤容重3分析图.png', width=Inches(6.0))
  666. if os.path.isfile(f'{mkdir_path}/土壤容重4分析图.png'):
  667. doc.add_picture(f'{mkdir_path}/土壤容重4分析图.png', width=Inches(6.0))
  668. if os.path.isfile(f'{mkdir_path}/土壤容重平均值分析图.png'):
  669. doc.add_picture(f'{mkdir_path}/土壤容重平均值分析图.png', width=Inches(6.0))
  670. if os.path.isfile(f'{mkdir_path}/水稳0.5mm~1mm分析图.png'):
  671. doc.add_picture(f'{mkdir_path}/水稳0.5mm~1mm分析图.png', width=Inches(6.0))
  672. if os.path.isfile(f'{mkdir_path}/水稳0.25mm~0.5mm分析图.png'):
  673. doc.add_picture(f'{mkdir_path}/水稳0.25mm~0.5mm分析图.png', width=Inches(6.0))
  674. if os.path.isfile(f'{mkdir_path}/水稳1mm~2mm分析图.png'):
  675. doc.add_picture(f'{mkdir_path}/水稳1mm~2mm分析图.png', width=Inches(6.0))
  676. if os.path.isfile(f'{mkdir_path}/水稳2mm~3mm分析图.png'):
  677. doc.add_picture(f'{mkdir_path}/水稳2mm~3mm分析图.png', width=Inches(6.0))
  678. if os.path.isfile(f'{mkdir_path}/水稳3mm~5mm分析图.png'):
  679. doc.add_picture(f'{mkdir_path}/水稳3mm~5mm分析图.png', width=Inches(6.0))
  680. if os.path.isfile(f'{mkdir_path}/水稳5mm分析图.png'):
  681. doc.add_picture(f'{mkdir_path}/水稳5mm分析图.png', width=Inches(6.0))
  682. doc.add_heading('附表4:数值修约标准', level=2)
  683. # 读取数据 插入表格 写入数据
  684. numData = pd.read_excel('./img/数值修约要求.xlsx', sheet_name='Sheet1')
  685. table_2_f = doc.add_table(rows=len(numData) + 1, cols=2, style='Light Shading Accent 1')
  686. table_2_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  687. for i, row in enumerate(table_2_f.rows):
  688. for j, cell in enumerate(row.cells):
  689. # 获取单元格中的段落对象
  690. paragraph = cell.paragraphs[0]
  691. if i == 0:
  692. r = paragraph.add_run(str(numData.columns[j]))
  693. r.font.bold = True
  694. else:
  695. r = paragraph.add_run(str(numData.iloc[i - 1, j]))
  696. r.font.size = Pt(10.5)
  697. r.font.name = 'Times New Roman'
  698. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  699. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  700. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  701. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  702. # 处理样式 遍历所有的段落 修改字体
  703. # 遍历并打印每个段落的文本
  704. paragraphs = doc.paragraphs
  705. for paragraph in paragraphs:
  706. for run in paragraph.runs:
  707. run.font.color.rgb = RGBColor(0, 0, 0)
  708. run.font.name = 'Times New Roman'
  709. run.font.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  710. # 保存Word文档
  711. doc.save(f'{mkdir_path}/{areaName}-{type}审核报告.docx')
  712. # 生成常规养分指标审核报告
  713. def getConventionalNutrientIndicators(originData,data,type, changeFileUrl, saveFileUrl, check_1_data,
  714. check_3_data,
  715. check_5_data,
  716. check_8_data, # 样品编号替换为编号
  717. check_10_data,
  718. check_12_data,
  719. check_14_data ):
  720. # 生成报告
  721. name = os.path.basename(changeFileUrl)
  722. n = name.split('.')
  723. areaName = n[0].replace('数据', '')
  724. # 生成一个新的文件夹用于存放审核报告相关的数据
  725. nowTime = time.strftime("%Y-%m-%d %H时%M分%S秒", time.localtime())
  726. dir_name = f'{areaName}-{type}数据审核报告'
  727. mkdir_path = saveFileUrl + '/' + dir_name + nowTime
  728. if not os.path.exists(mkdir_path):
  729. os.mkdir(mkdir_path)
  730. # 根据选择的路径读取数据
  731. ConventionalNutrientData = data[indexClassificationList[type]]
  732. ConventionalNutrientDataNum = originData[indexClassificationList[type]]
  733. report.getFrequencyImage(ConventionalNutrientData, mkdir_path)
  734. ConventionalNutrientData['序号'] = data['序号']
  735. ConventionalNutrientData['原样品编号'] = data['原样品编号']
  736. ConventionalNutrientData['样品编号'] = data['样品编号']
  737. ConventionalNutrientData['地理位置'] = data['地理位置']
  738. ConventionalNutrientData['母质'] = data['母质']
  739. ConventionalNutrientData['土壤类型'] = data['土壤类型']
  740. ConventionalNutrientData['土地利用类型'] = data['土地利用类型']
  741. # ConventionalNutrientData['土壤质地'] = data['土壤质地']
  742. ConventionalNutrientDataNum['序号'] = originData['序号']
  743. ConventionalNutrientDataNum['原样品编号'] = originData['原样品编号']
  744. ConventionalNutrientDataNum['样品编号'] = originData['样品编号']
  745. ConventionalNutrientDataNum['地理位置'] = originData['地理位置']
  746. ConventionalNutrientDataNum['母质'] = originData['母质']
  747. ConventionalNutrientDataNum['土壤类型'] = originData['土壤类型']
  748. ConventionalNutrientDataNum['土地利用类型'] = originData['土地利用类型']
  749. # 生成相应审核报告
  750. ConventionalNutrientData['原样品编号'] = ConventionalNutrientData['原样品编号'].astype(str)
  751. ConventionalNutrientDataNum['原样品编号'] = ConventionalNutrientDataNum['原样品编号'].astype(str)
  752. data['原样品编号'] = data['原样品编号'].astype(str)
  753. # checkData = pd.read_excel(changeFileUrl, sheet_name='检测方法')
  754. # 上面这个地址,可以纯递给函数中,用于保存表格和图片
  755. # 调用函数 开始生成报告相关内容
  756. # 表1相关数据
  757. typeData = report.getSimpleNum(ConventionalNutrientData)
  758. lenNum_1 = len(typeData['sData'])
  759. lenNum_1_f = len(typeData['allData'])
  760. table_1_data = pd.DataFrame({
  761. '类型': typeData['sData'].index,
  762. '数量': typeData['sData'],
  763. '合计': [typeData['sData'].sum() for _ in range(lenNum_1)]
  764. })
  765. # 表2数据
  766. table_2_data = report.getDataComplete(ConventionalNutrientData)
  767. table_2_data = table_2_data.reset_index()
  768. table_2_data.columns = ['指标名称', '实测数量', '应测数量']
  769. # 表3数据
  770. # table_3_data = report.checkMethod(checkData, mkdir_path)
  771. # 数据修约 表4
  772. report.getNum(ConventionalNutrientDataNum, mkdir_path)
  773. # 数据填报项审核 表5
  774. report.dataReportResult(ConventionalNutrientData, mkdir_path)
  775. # 表6数据 土壤质地类型不一致
  776. middData = data[['原样品编号', '样品编号']].astype(str)
  777. middData['编号'] = middData['原样品编号']
  778. del middData['原样品编号']
  779. check_1_data = pd.merge(check_1_data, middData, how='left', on='编号')
  780. check_1_data = check_1_data.replace(np.nan, '')
  781. # typeNotSame = check_1_data[check_1_data['土壤质地'] != check_1_data['土壤类型(判断)']]
  782. # table_6_data = typeNotSame[['编号', '样品编号', '土壤质地', '土壤类型(判断)']]
  783. allNeedData = pd.DataFrame({})
  784. allNeedData['原样品编号'] = check_1_data['编号']
  785. getSimpleDataNumber = pd.merge(allNeedData, ConventionalNutrientData[['原样品编号', '样品编号']], how='left', on="原样品编号")
  786. allNeedData['样品编号'] = getSimpleDataNumber['样品编号']
  787. allNeedData['土地利用类型'] = check_1_data['土地利用类型']
  788. allNeedData['审核结果'] = check_10_data['审核结果'] + check_12_data['审核结果']
  789. allNeedData['外业'] = ['' for _ in range(len(check_1_data))]
  790. table_7_data = allNeedData[allNeedData['审核结果'] != '']
  791. del table_7_data['审核结果']
  792. # 写进表格
  793. with pd.ExcelWriter(f'{mkdir_path}/超阈值样品统计表.xlsx', engine='openpyxl') as writer:
  794. table_7_data.to_excel(writer, index=False, sheet_name='超阈值数据')
  795. # 表8数据
  796. table_8_data = report.getPHData(ConventionalNutrientData, mkdir_path)
  797. # 表10 数据
  798. table_10_data = report.getNAndC(ConventionalNutrientData, mkdir_path)
  799. # 表11 数据:全磷和有效磷异常数据统计
  800. table_11_data = report.getPData(ConventionalNutrientData, mkdir_path)
  801. report.getKData(ConventionalNutrientData, mkdir_path)
  802. # 表13 所有存疑数据
  803. with pd.ExcelWriter(f'{mkdir_path}/数据审核过程存疑数据一览表.xlsx', engine='openpyxl') as writer:
  804. allNeedData[allNeedData['审核结果'] != ''].to_excel(writer, index=False, sheet_name='存疑数据')
  805. # 附表: 频度分析图
  806. # report.getFrequencyImage(ConventionalNutrientData, mkdir_path)
  807. table_f_2_data = report.getFrequencyInformation(data, mkdir_path)
  808. # 新建一个文档
  809. doc = Document()
  810. # 添加标题
  811. doc.add_heading(f"{areaName}第三次全国土壤普查常规养分指标检测数据审核报告", level=0)
  812. # 在文档中添加封面段落
  813. fm = doc.add_paragraph()
  814. fm = doc.add_paragraph()
  815. fm = doc.add_paragraph()
  816. fm = doc.add_paragraph()
  817. fm = doc.add_paragraph()
  818. # 插入图片,设置宽度为6英寸(可根据需求调整)
  819. run = fm.add_run()
  820. run.add_picture( 'img/第三次全国土壤普查img.png', width=Inches(2.26))
  821. fm.alignment = WD_TABLE_ALIGNMENT.CENTER
  822. # 在文档中添加封面段落
  823. fm = doc.add_paragraph()
  824. fm = doc.add_paragraph()
  825. fm = doc.add_paragraph()
  826. fm = doc.add_paragraph()
  827. fm = doc.add_paragraph()
  828. fm = doc.add_paragraph()
  829. # 获取当前日期
  830. current_date = datetime.now()
  831. # 将年份和月份转换为中文大写数字
  832. year = int(current_date.strftime("%Y")) # 转换为整数
  833. month = int(current_date.strftime("%m")) # 转换为整数
  834. # 使用 cn2an 将数字转换为中文大写
  835. year_chinese =number_to_chinese_year(year) # 年份转换
  836. month_chinese = cn2an.an2cn(month) # 月份转换
  837. current_date_formatted = f"{year_chinese}年{month_chinese}月"
  838. # 组合动态文本
  839. dynamic_text = f"安徽农业大学资源与环境学院\n{current_date_formatted}"
  840. # 添加文字并居中
  841. text_paragraph = doc.add_paragraph()
  842. text_run = text_paragraph.add_run(dynamic_text)
  843. text_run.font.name = "宋体"
  844. text_run.font.size = Pt(18)
  845. text_run.bold = True # 设置字体加粗
  846. text_paragraph.alignment = 1 # 1 表示居中对齐
  847. # 正确插入分页符
  848. doc.add_page_break()
  849. heading = doc.add_heading('总体概述', level=1)
  850. heading.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  851. # 第一段
  852. long_text1 = f"""
  853. {areaName}第三次全国土壤普查县级数据审核报告主要通过收集和整理相关数据,并对其进行内业检测数据的完整性、规范性和合理性进行审核,形成存疑样点清单及存疑样点结果判定,最终编制完成数据审核报告,同时提交( )对相关指标进行整改复测。报告整理了( )个表层样品数据(含平行样、质控样)、( )个水稳性大团聚体样品数据(含平行样)、( )个剖面样品数据(含平行样、质控样),共( )次样品检测结果分析情况。相关结果分别按照物理性指标检测数据、一般化学指标检测数据、常规养分指标检测数据和重金属指标检测数据形成四份报告。本报告为表层样常规养分指标检测数据审核报告。
  854. """
  855. para0 = doc.add_paragraph(long_text1)
  856. run0 = para0.runs[0] # 获取段落中的第一个run对象
  857. run0.font.name = '宋体' # 设置字体为宋体
  858. run0.font.size = Pt(11) # 设置字号为11磅
  859. # 设置段落的行间距为1.5倍
  860. para_format = para0.paragraph_format
  861. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  862. # 添加一级标题
  863. doc.add_heading('一、数据完整性审核', level=1)
  864. # 第二段
  865. long_text2 = """
  866. 外业信息调查采样环节:采用电子围栏和外业调查采样APP,对采样位置和填报信息进行管理,确保外业调查信息填报完整。
  867. 样品检测数据上报环节:通过土壤普查工作平台对上报数据的完整性进行筛查。( )第三次土壤普查相关指标检测数据由( )提供,数据均已通过省级质控实验室和县级土壤普查办审核;相关土壤指标历史数据则由( )第三次土壤普查办公室提供。根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》要求,统计各土地利用类型的样品数量,并按照耕地园地土壤样品(表层/剖面)、林地草地土壤样品(表层/剖面)以及水稳定性大团聚体样品(见表1)进行分类,编制了指标名称与实际检测样品数量统计表(见表2),其中水溶性盐分总量大于1g/kg,增加检测了八大离子(该指标在化学指标检测数据审核报告内)。
  868. """
  869. para = doc.add_paragraph(long_text2)
  870. run1 = para.runs[0]
  871. run1.font.name = '宋体' # 设置字体为宋体
  872. run1.font.size = Pt(11) # 设置字号为11磅
  873. # 设置段落的行间距为1.5倍
  874. para_format = para.paragraph_format
  875. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  876. doc.add_heading('1、土地利用类型与检测指标符合性审核', level=2)
  877. # 插入表格1
  878. paragraph_1 = doc.add_paragraph()
  879. paragraph_1.add_run(f"表1:{areaName}三普样品数量统计表(表层)").bold = True
  880. # 设置居中
  881. paragraph_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  882. table_1 = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  883. table_1.alignment = WD_TABLE_ALIGNMENT.CENTER
  884. # 遍历表格 插入数据
  885. # 遍历表格的所有单元格,并填充内容
  886. for i, row in enumerate(table_1.rows):
  887. for j, cell in enumerate(row.cells):
  888. # 获取单元格中的段落对象
  889. paragraph = cell.paragraphs[0]
  890. if i == 0:
  891. r = paragraph.add_run(str(table_1_data.columns[j]))
  892. r.font.bold = True
  893. else:
  894. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  895. r.font.size = Pt(10.5)
  896. r.font.name = 'Times New Roman'
  897. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  898. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  899. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  900. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  901. # 合并单元格 合并第3列的第二行和第三行
  902. if lenNum_1 > 1:
  903. table_1.cell(2, 2).text = ''
  904. table_1.cell(1, 2).merge(table_1.cell(2, 2))
  905. ############test##############
  906. doc.add_heading('2、指标名称与实际检测样品数量完整性审核', level=2)
  907. # 插入表格2
  908. paragraph_2 = doc.add_paragraph()
  909. paragraph_2.add_run(f'表2:{areaName}指标名称与实际检测样品数量统计表').bold = True
  910. table_2 = doc.add_table(rows=len(table_2_data) + 1, cols=3, style='Light Shading Accent 1')
  911. paragraph_2.alignment = WD_ALIGN_PARAGRAPH.CENTER
  912. table_2.alignment = WD_TABLE_ALIGNMENT.CENTER
  913. for i, row in enumerate(table_2.rows):
  914. for j, cell in enumerate(row.cells):
  915. # 获取单元格中的段落对象
  916. paragraph = cell.paragraphs[0]
  917. if i == 0:
  918. r = paragraph.add_run(str(table_2_data.columns[j]))
  919. r.font.bold = True
  920. else:
  921. r = paragraph.add_run(str(table_2_data.iloc[i - 1, j]))
  922. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  923. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  924. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  925. r.font.size = Pt(10.5)
  926. r.font.name = 'Times New Roman'
  927. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  928. doc.add_heading('二、数据规范性审核', level=1)
  929. long_text3 = """
  930. 按照《第三次全国土壤普查暂行土壤分类系统 (试行)》、《第三次全国土壤普查工作底图制作与采样点布设技术规范》、《第三次全国土壤普查土壤类型图编制技术规范》《第三次全国土壤普查土壤样品制备与检测技术规范》等规范统一标准和表现形式,土地利用方式按照第三次国土调查土地利用信息统一,种植制度按照农业区划信息进行统一。三普工作平台同时内置指标量纲、数字修约和允差等,控制数据规范性。
  931. 根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》,对检测指标对应的检测方法与相关标准或规范进行审核,得到检测方法审核、数值修约审核、数据填报项审核结果,未检出项填报以检出限的一半上报并加注*号。根据土壤普查教材中机械组成分类参考表,并进行宁国土壤质地填报审核结果表(见表6)。
  932. """
  933. para = doc.add_paragraph(long_text3)
  934. run1 = para.runs[0]
  935. run1.font.name = '宋体' # 设置字体为宋体
  936. run1.font.size = Pt(11) # 设置字号为11磅
  937. doc.add_heading('1、数据填报规范性审核', level=2)
  938. doc.add_heading('1、数据填报规范性审核', level=2)
  939. # 插入表3
  940. paragraph_3 = doc.add_paragraph()
  941. paragraph_3.add_run(f'表3:{areaName}土壤检测数据检测方法填报审核结果表').bold = True
  942. # table_3 = doc.add_table(rows=2, cols=2)
  943. paragraph_3.alignment = WD_ALIGN_PARAGRAPH.CENTER
  944. # table_3.alignment = WD_TABLE_ALIGNMENT.CENTER
  945. # 写入数据 这里数据写不下 嵌入链接
  946. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:检测方法审核结果.xlsx', level=4)
  947. doc.add_heading('2、数值修约规范性审核', level=2)
  948. # 插入表4
  949. paragraph_4 = doc.add_paragraph()
  950. paragraph_4.add_run(f'表4:{areaName}土壤检测数据数值修约结果表').bold = True
  951. # table_4 = doc.add_table(rows=2, cols=2)
  952. paragraph_4.alignment = WD_ALIGN_PARAGRAPH.CENTER
  953. # table_4.alignment = WD_TABLE_ALIGNMENT.CENTER
  954. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数值修约审核.xlsx', level=4)
  955. # 填入数据 这里数据也放不下 嵌入链接
  956. doc.add_heading('3、数据未检出的填报规范性审核', level=2)
  957. # 插入表5
  958. paragraph_5 = doc.add_paragraph()
  959. paragraph_5.add_run(f'表5:{areaName}土壤检测数据未检出项填报审核结果表').bold = True
  960. # table_5 = doc.add_table(rows=2, cols=2)
  961. paragraph_5.alignment = WD_ALIGN_PARAGRAPH.CENTER
  962. # table_5.alignment = WD_TABLE_ALIGNMENT.CENTER
  963. # 写入数据 这里数据也放不下 嵌入链接
  964. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据填报项审核结果.xlsx', level=4)
  965. # doc.add_heading('4、土壤质地填报规范性审核', level=2)
  966. # # 插入表6
  967. # paragraph_6 = doc.add_paragraph()
  968. # paragraph_6.add_run(f'表6:{areaName}土壤质地填报审核结果表').bold = True
  969. # table_6 = doc.add_table(rows=len(table_6_data) + 1, cols=4, style='Light Shading Accent 1')
  970. # paragraph_6.alignment = WD_ALIGN_PARAGRAPH.CENTER
  971. # table_6.alignment = WD_TABLE_ALIGNMENT.CENTER
  972. # # 提取结果表中数据
  973. # # 写入数据 土壤质地类型不一致的数据提取出来
  974. # for i, row in enumerate(table_6.rows):
  975. # for j, cell in enumerate(row.cells):
  976. # # 获取单元格中的段落对象
  977. # paragraph = cell.paragraphs[0]
  978. # if i == 0:
  979. # r = paragraph.add_run(str(table_6_data.columns[j]))
  980. # r.font.bold = True
  981. # else:
  982. # r = paragraph.add_run(str(table_6_data.iloc[i - 1, j]))
  983. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  984. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  985. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  986. # r.font.size = Pt(10.5)
  987. # r.font.name = 'Times New Roman'
  988. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  989. doc.add_heading('三、数据合理性审核', level=1)
  990. long_text4 = """
  991. 明确数据审核原则,结合外业调查采样,获取的成土环境、土壤利用现状等信息对结果进行综合评价。通过阈值分析、关联分析、逻辑分析等方法对数据准确性进行判断。
  992. 阈值法(国家和省级数据阈值):结合区域历史数据建立阈值,平台利用阈值法(国家和省级数据值)自动对检测数据进行初步审核,并对超出阈值范围数据做出警示标识,专家或专业技术人员结合区域实际、专家经验判定异常值并对异常数据进行驳回。超出阈值颜色标注。
  993. 红色: 超出国家阈值,维持试点期间的标红。
  994. 黄色: 省级阈值在国家阈值范围内的,数据超出省级阈值标黄。
  995. 紫色: 省级阈值超出国家阈值的,数据超出省级阈值标成紫色(注,此种情况超国家阈值的红色服从紫色,仅标紫色)
  996. 极值法: 常用的统计量是均值、标准差、最大值、最小值、分位数等,用来判断是否超出了合理的极值范围。根据相关指标历年数据与指标最大值、最小值、平均数、中位数和极差进行审查,结合相关外业情况。
  997. 关联分析方法: 存在量化关系的指标,通过设定组合筛选异常值,如碳氮比等关联分析。
  998. 指标综合分析:根据指标相互之间的关系,如有效磷在全磷中的占比、全钾与速效钾缓效钾之和的关系等。有机质、全磷、有效磷、全钾等数据异常; 全氮和有机质之间关系不合理; 速效钾含量远大于缓效钾,盐基总量远大于阳离子交换量; 部分样品阳离子交换量和交换性盐基总量测定结果偏低; 水溶盐离子总量与全盐量的相对偏差已远超过方法规定的允差范围; 容重检测偏差比较大;水稳性大团聚体土壤于燥结块,影响测定结果、重金属按照风险筛选值和风险管控值等问题。
  999. 数据质量溯源:异常数据溯源,可能是内业测试化验环节问题,也有可能是外业调查采样问题,要结合数据检测和异常复检情况具体判断。
  1000. """
  1001. para = doc.add_paragraph(long_text4)
  1002. run1 = para.runs[0]
  1003. run1.font.name = '宋体' # 设置字体为宋体
  1004. run1.font.size = Pt(11) # 设置字号为11磅
  1005. doc.add_heading('1、阈值法审核', level=2)
  1006. # 插入表格
  1007. paragraph_7 = doc.add_paragraph()
  1008. paragraph_7.add_run(f'表6:{areaName}土壤检测数据超阈值样品统计表').bold = True
  1009. # table_7 = doc.add_table(rows=2, cols=2)
  1010. # paragraph_7.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1011. # table_7.alignment = WD_TABLE_ALIGNMENT.CENTER
  1012. # 写入数据 点击查看数据 这里也不一定写的下 最好是嵌入链接
  1013. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  1014. # todo 合并所有数据 审核结果不为空的数据 写入表格保存到指定文件夹
  1015. doc.add_heading('2、极值法审核', level=2)
  1016. doc.add_heading('(1)pH', level=3)
  1017. # 插入ph分布图
  1018. if os.path.isfile(f'{mkdir_path}/PH值分布图.png'):
  1019. doc.add_picture(f'{mkdir_path}/PH值分布图.png', width=Inches(6.0))
  1020. paragraph_t_1 = doc.add_paragraph()
  1021. paragraph_t_1.add_run(f'图1:pH值分布情况').bold = True
  1022. paragraph_t_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1023. # 插入频度统计表
  1024. paragraph_8 = doc.add_paragraph()
  1025. paragraph_8.add_run('表7:pH数据统计表').bold = True
  1026. table_8 = doc.add_table(rows=6, cols=2, style='Light Shading Accent 1')
  1027. t_8 = table_8_data['频度分析']
  1028. t_8 = t_8.reset_index()
  1029. t_8.columns = ['指标', '数据']
  1030. paragraph_8.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1031. table_8.alignment = WD_TABLE_ALIGNMENT.CENTER
  1032. for i, row in enumerate(table_8.rows):
  1033. for j, cell in enumerate(row.cells):
  1034. # 获取单元格中的段落对象
  1035. paragraph = cell.paragraphs[0]
  1036. if i == 0:
  1037. r = paragraph.add_run(str(t_8.columns[j]))
  1038. r.font.bold = True
  1039. else:
  1040. r = paragraph.add_run(str(t_8.iloc[i - 1, j]))
  1041. r.font.size = Pt(10.5)
  1042. r.font.name = 'Times New Roman'
  1043. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1044. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1045. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1046. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1047. # 插入异常数据提取表格 todo 这里数据多的话也可能写不下 最好是嵌入一下
  1048. if not table_8_data['异常数据'].empty:
  1049. paragraph_9 = doc.add_paragraph()
  1050. paragraph_9.add_run('表8:pH异常数据统计表').bold = True
  1051. table_9 = doc.add_table(rows=len(table_8_data['异常数据']) + 1, cols=6, style='Light Shading Accent 1')
  1052. t_9 = table_8_data['异常数据']
  1053. paragraph_9.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1054. table_9.alignment = WD_TABLE_ALIGNMENT.CENTER
  1055. for i, row in enumerate(table_9.rows):
  1056. for j, cell in enumerate(row.cells):
  1057. # 获取单元格中的段落对象
  1058. paragraph = cell.paragraphs[0]
  1059. if i == 0:
  1060. r = paragraph.add_run(str(t_9.columns[j]))
  1061. r.font.bold = True
  1062. else:
  1063. r = paragraph.add_run(str(t_9.iloc[i - 1, j]))
  1064. r.font.size = Pt(10.5)
  1065. r.font.name = 'Times New Roman'
  1066. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1067. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1068. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1069. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1070. doc.add_heading('3、关联分析法审核', level=2)
  1071. if os.path.isfile(f'{mkdir_path}/有机质与全氮相关性散点图.png'):
  1072. doc.add_picture(f'{mkdir_path}/有机质与全氮相关性散点图.png', width=Inches(6.0))
  1073. paragraph_t_2 = doc.add_paragraph()
  1074. paragraph_t_2.add_run(f'图2:有机质与全氮相关关系').bold = True
  1075. paragraph_t_2.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1076. # 插入碳氮比异常数据
  1077. if not table_10_data.empty:
  1078. paragraph_10 = doc.add_paragraph()
  1079. paragraph_10.add_run('表9:碳氮比异常数据统计表').bold = True
  1080. table_10 = doc.add_table(rows=len(table_10_data) + 1, cols=8, style='Light Shading Accent 1')
  1081. paragraph_10.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1082. table_10.alignment = WD_TABLE_ALIGNMENT.CENTER
  1083. for i, row in enumerate(table_10.rows):
  1084. for j, cell in enumerate(row.cells):
  1085. # 获取单元格中的段落对象
  1086. paragraph = cell.paragraphs[0]
  1087. if i == 0:
  1088. r = paragraph.add_run(str(table_10_data.columns[j]))
  1089. r.font.bold = True
  1090. else:
  1091. r = paragraph.add_run(str(table_10_data.iloc[i - 1, j]))
  1092. r.font.size = Pt(10.5)
  1093. r.font.name = 'Times New Roman'
  1094. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1095. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1096. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1097. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1098. doc.add_heading('4、指标综合分析', level=2)
  1099. # 插入图片
  1100. if os.path.isfile(f'{mkdir_path}/全磷分布图.png'):
  1101. doc.add_picture(f'{mkdir_path}/全磷分布图.png', width=Inches(6.0))
  1102. paragraph_t_3 = doc.add_paragraph()
  1103. paragraph_t_3.add_run(f'图3:全磷分布图').bold = True
  1104. paragraph_t_3.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1105. if os.path.isfile(f'{mkdir_path}/有效磷分布图.png'):
  1106. doc.add_picture(f'{mkdir_path}/有效磷分布图.png', width=Inches(6.0))
  1107. paragraph_t_4 = doc.add_paragraph()
  1108. paragraph_t_4.add_run(f'图4:有效磷分布图').bold = True
  1109. paragraph_t_4.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1110. # 插入图片
  1111. if os.path.isfile(f'{mkdir_path}/有效磷占全磷比分布图.png'):
  1112. doc.add_picture(f'{mkdir_path}/有效磷占全磷比分布图.png', width=Inches(6.0))
  1113. paragraph_t_5 = doc.add_paragraph()
  1114. paragraph_t_5.add_run(f'图5:有效磷含量占全磷含量比例').bold = True
  1115. paragraph_t_5.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1116. # 插入表格
  1117. if not table_11_data.empty:
  1118. paragraph_11 = doc.add_paragraph()
  1119. paragraph_11.add_run('表10:全磷与有效磷异常样品统计表').bold = True
  1120. table_11 = doc.add_table(rows=len(table_11_data) + 1, cols=7, style='Light Shading Accent 1')
  1121. paragraph_11.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1122. table_11.alignment = WD_TABLE_ALIGNMENT.CENTER
  1123. for i, row in enumerate(table_11.rows):
  1124. for j, cell in enumerate(row.cells):
  1125. # 获取单元格中的段落对象
  1126. paragraph = cell.paragraphs[0]
  1127. if i == 0:
  1128. r = paragraph.add_run(str(table_11_data.columns[j]))
  1129. r.font.bold = True
  1130. else:
  1131. r = paragraph.add_run(str(table_11_data.iloc[i - 1, j]))
  1132. r.font.size = Pt(10.5)
  1133. r.font.name = 'Times New Roman'
  1134. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1135. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1136. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1137. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1138. else:
  1139. paragraph_11 = doc.add_paragraph()
  1140. paragraph_11.add_run('表10:全磷与有效磷异常样品统计表').bold = True
  1141. paragraph_11_info = doc.add_paragraph()
  1142. paragraph_11_info.add_run('无异常数据')
  1143. paragraph_11.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1144. paragraph_11_info.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1145. # 全钾、速效钾、缓效钾
  1146. if os.path.isfile(f'{mkdir_path}/全钾与速效钾缓效钾之和关系统计图.png'):
  1147. doc.add_picture(f'{mkdir_path}/全钾与速效钾缓效钾之和关系统计图.png', width=Inches(6.0))
  1148. paragraph_t_6 = doc.add_paragraph()
  1149. paragraph_t_6.add_run(f'图6:全钾与速效钾缓效钾之和关系统计图').bold = True
  1150. paragraph_t_6.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1151. if os.path.isfile(f'{mkdir_path}/速效钾与缓效钾散点图.png'):
  1152. doc.add_picture(f'{mkdir_path}/速效钾与缓效钾散点图.png', width=Inches(6.0))
  1153. paragraph_t_7 = doc.add_paragraph()
  1154. paragraph_t_7.add_run(f'图7:速效钾与缓效钾散点图').bold = True
  1155. paragraph_t_7.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1156. doc.add_heading('四、审核存疑数据', level=1)
  1157. paragraph_12 = doc.add_paragraph()
  1158. paragraph_12.add_run(f'表11:数据审核过程存疑数据一览表').bold = True
  1159. paragraph_12.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1160. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  1161. doc.add_heading('五、附表', level=1)
  1162. doc.add_heading('附表1:某区三普样品数量统计表(表层)', level=2)
  1163. # 插入附表1
  1164. table_1_f = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  1165. table_1_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  1166. # 遍历表格 插入数据
  1167. # 遍历表格的所有单元格,并填充内容
  1168. for i, row in enumerate(table_1_f.rows):
  1169. for j, cell in enumerate(row.cells):
  1170. # 获取单元格中的段落对象
  1171. paragraph = cell.paragraphs[0]
  1172. if i == 0:
  1173. r = paragraph.add_run(str(table_1_data.columns[j]))
  1174. r.font.bold = True
  1175. else:
  1176. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  1177. r.font.size = Pt(10.5)
  1178. r.font.name = 'Times New Roman'
  1179. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1180. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1181. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1182. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1183. # 合并单元格 合并第3列的第二行和第三行
  1184. if lenNum_1 > 1:
  1185. table_1_f.cell(2, 2).text = ''
  1186. table_1_f.cell(1, 2).merge(table_1_f.cell(2, 2))
  1187. doc.add_heading('附表2:各指标频度分析表', level=2)
  1188. # 插入表格 写入数据
  1189. table_f_2_data = table_f_2_data.replace(np.nan, '')
  1190. makeInfoTable(table_f_2_data, doc)
  1191. # table_f_2 = doc.add_table(rows=len(table_f_2_data) + 1, cols=6, style='Light Shading Accent 1')
  1192. # for i, row in enumerate(table_f_2.rows):
  1193. # for j, cell in enumerate(row.cells):
  1194. # # 获取单元格中的段落对象
  1195. # paragraph = cell.paragraphs[0]
  1196. # if i == 0:
  1197. # r = paragraph.add_run(str(table_f_2_data.columns[j]))
  1198. # r.font.bold = True
  1199. # else:
  1200. # r = paragraph.add_run(str(table_f_2_data.iloc[i - 1, j]))
  1201. # r.font.size = Pt(10.5)
  1202. # r.font.name = 'Times New Roman'
  1203. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1204. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1205. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1206. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1207. # doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:频度分析表.xlsx', level=4)
  1208. doc.add_heading('附表3:各指标频度分析图', level=2)
  1209. # 插入频度信息的图形
  1210. if os.path.isfile(f'{mkdir_path}/pH分析图.png'):
  1211. doc.add_picture(f'{mkdir_path}/pH分析图.png', width=Inches(6.0))
  1212. if os.path.isfile(f'{mkdir_path}/缓效钾分析图.png'):
  1213. doc.add_picture(f'{mkdir_path}/缓效钾分析图.png', width=Inches(6.0))
  1214. if os.path.isfile(f'{mkdir_path}/全氮分析图.png'):
  1215. doc.add_picture(f'{mkdir_path}/全氮分析图.png', width=Inches(6.0))
  1216. if os.path.isfile(f'{mkdir_path}/全钾分析图.png'):
  1217. doc.add_picture(f'{mkdir_path}/全钾分析图.png', width=Inches(6.0))
  1218. if os.path.isfile(f'{mkdir_path}/全磷分析图.png'):
  1219. doc.add_picture(f'{mkdir_path}/全磷分析图.png', width=Inches(6.0))
  1220. if os.path.isfile(f'{mkdir_path}/速效钾分析图.png'):
  1221. doc.add_picture(f'{mkdir_path}/速效钾分析图.png', width=Inches(6.0))
  1222. if os.path.isfile(f'{mkdir_path}/有机质分析图.png'):
  1223. doc.add_picture(f'{mkdir_path}/有机质分析图.png', width=Inches(6.0))
  1224. if os.path.isfile(f'{mkdir_path}/有效硅分析图.png'):
  1225. doc.add_picture(f'{mkdir_path}/有效硅分析图.png', width=Inches(6.0))
  1226. if os.path.isfile(f'{mkdir_path}/有效磷分析图.png'):
  1227. doc.add_picture(f'{mkdir_path}/有效磷分析图.png', width=Inches(6.0))
  1228. if os.path.isfile(f'{mkdir_path}/有效硫分析图.png'):
  1229. doc.add_picture(f'{mkdir_path}/有效硫分析图.png', width=Inches(6.0))
  1230. if os.path.isfile(f'{mkdir_path}/有效锰分析图.png'):
  1231. doc.add_picture(f'{mkdir_path}/有效锰分析图.png', width=Inches(6.0))
  1232. if os.path.isfile(f'{mkdir_path}/有效钼分析图.png'):
  1233. doc.add_picture(f'{mkdir_path}/有效钼分析图.png', width=Inches(6.0))
  1234. if os.path.isfile(f'{mkdir_path}/有效硼分析图.png'):
  1235. doc.add_picture(f'{mkdir_path}/有效硼分析图.png', width=Inches(6.0))
  1236. if os.path.isfile(f'{mkdir_path}/有效铁分析图.png'):
  1237. doc.add_picture(f'{mkdir_path}/有效铁分析图.png', width=Inches(6.0))
  1238. if os.path.isfile(f'{mkdir_path}/有效铜分析图.png'):
  1239. doc.add_picture(f'{mkdir_path}/有效铜分析图.png', width=Inches(6.0))
  1240. if os.path.isfile(f'{mkdir_path}/有效锌分析图.png'):
  1241. doc.add_picture(f'{mkdir_path}/有效锌分析图.png', width=Inches(6.0))
  1242. doc.add_heading('附表4:数值修约标准', level=2)
  1243. # 读取数据 插入表格 写入数据
  1244. numData = pd.read_excel('./img/数值修约要求.xlsx', sheet_name='Sheet1')
  1245. table_2_f = doc.add_table(rows=len(numData) + 1, cols=2, style='Light Shading Accent 1')
  1246. table_2_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  1247. for i, row in enumerate(table_2_f.rows):
  1248. for j, cell in enumerate(row.cells):
  1249. # 获取单元格中的段落对象
  1250. paragraph = cell.paragraphs[0]
  1251. if i == 0:
  1252. r = paragraph.add_run(str(numData.columns[j]))
  1253. r.font.bold = True
  1254. else:
  1255. r = paragraph.add_run(str(numData.iloc[i - 1, j]))
  1256. r.font.size = Pt(10.5)
  1257. r.font.name = 'Times New Roman'
  1258. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1259. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1260. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1261. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1262. # 处理样式 遍历所有的段落 修改字体
  1263. # 遍历并打印每个段落的文本
  1264. paragraphs = doc.paragraphs
  1265. for paragraph in paragraphs:
  1266. for run in paragraph.runs:
  1267. run.font.color.rgb = RGBColor(0, 0, 0)
  1268. run.font.name = 'Times New Roman'
  1269. run.font.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1270. # 保存Word文档
  1271. doc.save(f'{mkdir_path}/{areaName}-{type}审核报告.docx')
  1272. # 生成一般化学性指标审核报告
  1273. def getChemicalIndicators(originData,data,type, changeFileUrl, saveFileUrl, check_1_data,
  1274. check_3_data,
  1275. check_5_data,
  1276. check_8_data, # 样品编号替换为编号
  1277. check_10_data,
  1278. check_12_data,
  1279. check_14_data):
  1280. # 生成报告
  1281. name = os.path.basename(changeFileUrl)
  1282. n = name.split('.')
  1283. areaName = n[0].replace('数据', '')
  1284. # 生成一个新的文件夹用于存放审核报告相关的数据
  1285. nowTime = time.strftime("%Y-%m-%d %H时%M分%S秒", time.localtime())
  1286. dir_name = f'{areaName}-{type}数据审核报告'
  1287. mkdir_path = saveFileUrl + '/' + dir_name + nowTime
  1288. if not os.path.exists(mkdir_path):
  1289. os.mkdir(mkdir_path)
  1290. # 根据选择的路径读取数据
  1291. cheemicalData = data[indexClassificationList[type]]
  1292. cheemicalDataNum = originData[indexClassificationList[type]]
  1293. report.getFrequencyImage(cheemicalData, mkdir_path)
  1294. cheemicalData['序号'] = data['序号']
  1295. cheemicalData['原样品编号'] = data['原样品编号']
  1296. cheemicalData['样品编号'] = data['样品编号']
  1297. cheemicalData['地理位置'] = data['地理位置']
  1298. cheemicalData['母质'] = data['母质']
  1299. cheemicalData['土壤类型'] = data['土壤类型']
  1300. cheemicalData['土地利用类型'] = data['土地利用类型']
  1301. # cheemicalData['土壤质地'] = data['土壤质地']
  1302. cheemicalData['原样品编号'] = cheemicalData['原样品编号'].astype(str)
  1303. # checkData = pd.read_excel(changeFileUrl, sheet_name='检测方法')
  1304. cheemicalDataNum['序号'] = originData['序号']
  1305. cheemicalDataNum['原样品编号'] = originData['原样品编号']
  1306. cheemicalDataNum['样品编号'] = originData['样品编号']
  1307. cheemicalDataNum['地理位置'] = originData['地理位置']
  1308. cheemicalDataNum['母质'] = originData['母质']
  1309. cheemicalDataNum['土壤类型'] = originData['土壤类型']
  1310. cheemicalDataNum['土地利用类型'] = originData['土地利用类型']
  1311. # cheemicalData['土壤质地'] = data['土壤质地']
  1312. cheemicalDataNum['原样品编号'] = cheemicalDataNum['原样品编号'].astype(str)
  1313. # 上面这个地址,可以纯递给函数中,用于保存表格和图片
  1314. # 调用函数 开始生成报告相关内容
  1315. # 表1相关数据
  1316. typeData = report.getSimpleNum(cheemicalData)
  1317. lenNum_1 = len(typeData['sData'])
  1318. lenNum_1_f = len(typeData['allData'])
  1319. table_1_data = pd.DataFrame({
  1320. '类型': typeData['sData'].index,
  1321. '数量': typeData['sData'],
  1322. '合计': [typeData['sData'].sum() for _ in range(lenNum_1)]
  1323. })
  1324. # 表2数据
  1325. table_2_data = report.getDataComplete(cheemicalData)
  1326. table_2_data = table_2_data.reset_index()
  1327. table_2_data.columns = ['指标名称', '实测数量', '应测数量']
  1328. # 表3数据
  1329. # table_3_data = report.checkMethod(checkData, mkdir_path)
  1330. # 数据修约 表4
  1331. report.getNum(cheemicalDataNum, mkdir_path)
  1332. # 数据填报项审核 表5
  1333. report.dataReportResult(cheemicalData, mkdir_path)
  1334. # 表6数据 土壤质地类型不一致
  1335. middData = data[['原样品编号', '样品编号']].astype(str)
  1336. middData['编号'] = middData['原样品编号']
  1337. del middData['原样品编号']
  1338. check_1_data = pd.merge(check_1_data, middData, how='left', on='编号')
  1339. check_1_data = check_1_data.replace(np.nan, '')
  1340. # typeNotSame = check_1_data[check_1_data['土壤质地'] != check_1_data['土壤类型(判断)']]
  1341. # table_6_data = typeNotSame[['编号', '样品编号', '土壤质地', '土壤类型(判断)']]
  1342. allNeedData = pd.DataFrame({})
  1343. allNeedData['原样品编号'] = check_1_data['编号']
  1344. getSimpleDataNumber = pd.merge(allNeedData, data[['原样品编号', '样品编号']], how='left', on="原样品编号")
  1345. allNeedData['样品编号'] = getSimpleDataNumber['样品编号']
  1346. allNeedData['土地利用类型'] = check_1_data['土地利用类型']
  1347. allNeedData['审核结果'] = check_5_data['审核结果'] + check_8_data['审核结果']
  1348. allNeedData['外业'] = ['' for _ in range(len(check_1_data))]
  1349. table_7_data = allNeedData[allNeedData['审核结果'] != '']
  1350. del table_7_data['审核结果']
  1351. # 写进表格
  1352. with pd.ExcelWriter(f'{mkdir_path}/超阈值样品统计表.xlsx', engine='openpyxl') as writer:
  1353. table_7_data.to_excel(writer, index=False, sheet_name='超阈值数据')
  1354. # 表8数据
  1355. table_8_data = report.getPHData(cheemicalData, mkdir_path)
  1356. report.cationExchangeCapacity(cheemicalData, mkdir_path)
  1357. report.changeCation(cheemicalData, mkdir_path)
  1358. report.manyTypes(cheemicalData, mkdir_path)
  1359. # 表13 所有存疑数据
  1360. with pd.ExcelWriter(f'{mkdir_path}/数据审核过程存疑数据一览表.xlsx', engine='openpyxl') as writer:
  1361. allNeedData[allNeedData['审核结果'] != ''].to_excel(writer, index=False, sheet_name='存疑数据')
  1362. # 附表: 频度分析图
  1363. # report.getFrequencyImage(cheemicalData, mkdir_path)
  1364. table_f_2_data = report.getFrequencyInformation(data, mkdir_path)
  1365. # 新建一个文档
  1366. doc = Document()
  1367. # 添加标题
  1368. doc.add_heading(f"{areaName}第三次全国土壤普查一般化学性指标检测数据审核报告", level=0)
  1369. # 在文档中添加封面段落
  1370. fm = doc.add_paragraph()
  1371. fm = doc.add_paragraph()
  1372. fm = doc.add_paragraph()
  1373. fm = doc.add_paragraph()
  1374. fm = doc.add_paragraph()
  1375. # 插入图片,设置宽度为6英寸(可根据需求调整)
  1376. run = fm.add_run()
  1377. run.add_picture('img/第三次全国土壤普查img.png', width=Inches(2.26))
  1378. fm.alignment = WD_TABLE_ALIGNMENT.CENTER
  1379. # 在文档中添加封面段落
  1380. fm = doc.add_paragraph()
  1381. fm = doc.add_paragraph()
  1382. fm = doc.add_paragraph()
  1383. fm = doc.add_paragraph()
  1384. fm = doc.add_paragraph()
  1385. fm = doc.add_paragraph()
  1386. # 获取当前日期
  1387. current_date = datetime.now()
  1388. # 将年份和月份转换为中文大写数字
  1389. year = int(current_date.strftime("%Y")) # 转换为整数
  1390. month = int(current_date.strftime("%m")) # 转换为整数
  1391. # 使用 cn2an 将数字转换为中文大写
  1392. year_chinese = number_to_chinese_year(year) # 年份转换
  1393. month_chinese = cn2an.an2cn(month) # 月份转换
  1394. current_date_formatted = f"{year_chinese}年{month_chinese}月"
  1395. # 组合动态文本
  1396. dynamic_text = f"安徽农业大学资源与环境学院\n{current_date_formatted}"
  1397. # 添加文字并居中
  1398. text_paragraph = doc.add_paragraph()
  1399. text_run = text_paragraph.add_run(dynamic_text)
  1400. text_run.font.name = "宋体"
  1401. text_run.font.size = Pt(18)
  1402. text_run.bold = True # 设置字体加粗
  1403. text_paragraph.alignment = 1 # 1 表示居中对齐
  1404. # 正确插入分页符
  1405. doc.add_page_break()
  1406. heading = doc.add_heading('总体概述', level=1)
  1407. heading.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1408. # 第一段
  1409. long_text1 = f"""
  1410. {areaName}第三次全国土壤普查县级数据审核报告主要通过收集和整理相关数据,并对其进行内业检测数据的完整性、规范性和合理性进行审核,形成存疑样点清单及存疑样点结果判定,最终编制完成数据审核报告,同时提交( )对相关指标进行整改复测。报告整理了( )个表层样品数据(含平行样、质控样)、( )个水稳性大团聚体样品数据(含平行样)、( )个剖面样品数据(含平行样、质控样),共( )次样品检测结果分析情况。相关结果分别按照物理性指标检测数据、一般化学指标检测数据、常规养分指标检测数据和重金属指标检测数据形成四份报告。本报告为表层样常规养分指标检测数据审核报告。
  1411. """
  1412. para0 = doc.add_paragraph(long_text1)
  1413. run0 = para0.runs[0] # 获取段落中的第一个run对象
  1414. run0.font.name = '宋体' # 设置字体为宋体
  1415. run0.font.size = Pt(11) # 设置字号为11磅
  1416. # 设置段落的行间距为1.5倍
  1417. para_format = para0.paragraph_format
  1418. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  1419. # 添加一级标题
  1420. doc.add_heading('一、数据完整性审核', level=1)
  1421. # 第二段
  1422. long_text2 = """
  1423. 外业信息调查采样环节:采用电子围栏和外业调查采样APP,对采样位置和填报信息进行管理,确保外业调查信息填报完整。
  1424. 样品检测数据上报环节:通过土壤普查工作平台对上报数据的完整性进行筛查。( )第三次土壤普查相关指标检测数据由( )提供,数据均已通过省级质控实验室和县级土壤普查办审核;相关土壤指标历史数据则由( )第三次土壤普查办公室提供。根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》要求,统计各土地利用类型的样品数量,并按照耕地园地土壤样品(表层/剖面)、林地草地土壤样品(表层/剖面)以及水稳定性大团聚体样品(见表1)进行分类,编制了指标名称与实际检测样品数量统计表(见表2),其中水溶性盐分总量大于1g/kg,增加检测了八大离子(该指标在化学指标检测数据审核报告内)。
  1425. """
  1426. para = doc.add_paragraph(long_text2)
  1427. run1 = para.runs[0]
  1428. run1.font.name = '宋体' # 设置字体为宋体
  1429. run1.font.size = Pt(11) # 设置字号为11磅
  1430. # 设置段落的行间距为1.5倍
  1431. para_format = para.paragraph_format
  1432. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  1433. doc.add_heading('1、土地利用类型与检测指标符合性审核', level=2)
  1434. # 插入表格1
  1435. paragraph_1 = doc.add_paragraph()
  1436. paragraph_1.add_run(f"表1:{areaName}三普样品数量统计表(表层)").bold = True
  1437. # 设置居中
  1438. paragraph_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1439. table_1 = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  1440. table_1.alignment = WD_TABLE_ALIGNMENT.CENTER
  1441. # 遍历表格 插入数据
  1442. # 遍历表格的所有单元格,并填充内容
  1443. for i, row in enumerate(table_1.rows):
  1444. for j, cell in enumerate(row.cells):
  1445. # 获取单元格中的段落对象
  1446. paragraph = cell.paragraphs[0]
  1447. if i == 0:
  1448. r = paragraph.add_run(str(table_1_data.columns[j]))
  1449. r.font.bold = True
  1450. else:
  1451. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  1452. r.font.size = Pt(10.5)
  1453. r.font.name = 'Times New Roman'
  1454. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1455. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1456. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1457. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1458. # 合并单元格 合并第3列的第二行和第三行
  1459. if lenNum_1 > 1:
  1460. table_1.cell(2, 2).text = ''
  1461. table_1.cell(1, 2).merge(table_1.cell(2, 2))
  1462. ############test##############
  1463. doc.add_heading('2、指标名称与实际检测样品数量完整性审核', level=2)
  1464. # 插入表格2
  1465. paragraph_2 = doc.add_paragraph()
  1466. paragraph_2.add_run(f'表2:{areaName}指标名称与实际检测样品数量统计表').bold = True
  1467. table_2 = doc.add_table(rows=len(table_2_data) + 1, cols=3, style='Light Shading Accent 1')
  1468. paragraph_2.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1469. table_2.alignment = WD_TABLE_ALIGNMENT.CENTER
  1470. for i, row in enumerate(table_2.rows):
  1471. for j, cell in enumerate(row.cells):
  1472. # 获取单元格中的段落对象
  1473. paragraph = cell.paragraphs[0]
  1474. if i == 0:
  1475. r = paragraph.add_run(str(table_2_data.columns[j]))
  1476. r.font.bold = True
  1477. else:
  1478. r = paragraph.add_run(str(table_2_data.iloc[i - 1, j]))
  1479. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1480. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1481. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1482. r.font.size = Pt(10.5)
  1483. r.font.name = 'Times New Roman'
  1484. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1485. doc.add_heading('二、数据规范性审核', level=1)
  1486. long_text3 = """
  1487. 按照《第三次全国土壤普查暂行土壤分类系统 (试行)》、《第三次全国土壤普查工作底图制作与采样点布设技术规范》、《第三次全国土壤普查土壤类型图编制技术规范》《第三次全国土壤普查土壤样品制备与检测技术规范》等规范统一标准和表现形式,土地利用方式按照第三次国土调查土地利用信息统一,种植制度按照农业区划信息进行统一。三普工作平台同时内置指标量纲、数字修约和允差等,控制数据规范性。
  1488. 根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》,对检测指标对应的检测方法与相关标准或规范进行审核,得到检测方法审核、数值修约审核、数据填报项审核结果,未检出项填报以检出限的一半上报并加注*号。根据土壤普查教材中机械组成分类参考表,并进行宁国土壤质地填报审核结果表(见表6)。
  1489. """
  1490. para = doc.add_paragraph(long_text3)
  1491. run1 = para.runs[0]
  1492. run1.font.name = '宋体' # 设置字体为宋体
  1493. run1.font.size = Pt(11) # 设置字号为11磅
  1494. doc.add_heading('1、数据填报规范性审核', level=2)
  1495. doc.add_heading('1、数据填报规范性审核', level=2)
  1496. # 插入表3
  1497. paragraph_3 = doc.add_paragraph()
  1498. paragraph_3.add_run(f'表3:{areaName}土壤检测数据检测方法填报审核结果表').bold = True
  1499. # table_3 = doc.add_table(rows=2, cols=2)
  1500. paragraph_3.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1501. # table_3.alignment = WD_TABLE_ALIGNMENT.CENTER
  1502. # 写入数据 这里数据写不下 嵌入链接
  1503. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:检测方法审核结果.xlsx', level=4)
  1504. doc.add_heading('2、数值修约规范性审核', level=2)
  1505. # 插入表4
  1506. paragraph_4 = doc.add_paragraph()
  1507. paragraph_4.add_run(f'表4:{areaName}土壤检测数据数值修约结果表').bold = True
  1508. # table_4 = doc.add_table(rows=2, cols=2)
  1509. paragraph_4.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1510. # table_4.alignment = WD_TABLE_ALIGNMENT.CENTER
  1511. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数值修约审核.xlsx', level=4)
  1512. # 填入数据 这里数据也放不下 嵌入链接
  1513. doc.add_heading('3、数据未检出的填报规范性审核', level=2)
  1514. # 插入表5
  1515. paragraph_5 = doc.add_paragraph()
  1516. paragraph_5.add_run(f'表5:{areaName}土壤检测数据未检出项填报审核结果表').bold = True
  1517. # table_5 = doc.add_table(rows=2, cols=2)
  1518. paragraph_5.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1519. # table_5.alignment = WD_TABLE_ALIGNMENT.CENTER
  1520. # 写入数据 这里数据也放不下 嵌入链接
  1521. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据填报项审核结果.xlsx', level=4)
  1522. # doc.add_heading('4、土壤质地填报规范性审核', level=2)
  1523. # # 插入表6
  1524. # paragraph_6 = doc.add_paragraph()
  1525. # paragraph_6.add_run(f'表6:{areaName}土壤质地填报审核结果表').bold = True
  1526. # table_6 = doc.add_table(rows=len(table_6_data) + 1, cols=4, style='Light Shading Accent 1')
  1527. # paragraph_6.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1528. # table_6.alignment = WD_TABLE_ALIGNMENT.CENTER
  1529. # # 提取结果表中数据
  1530. # # 写入数据 土壤质地类型不一致的数据提取出来
  1531. # for i, row in enumerate(table_6.rows):
  1532. # for j, cell in enumerate(row.cells):
  1533. # # 获取单元格中的段落对象
  1534. # paragraph = cell.paragraphs[0]
  1535. # if i == 0:
  1536. # r = paragraph.add_run(str(table_6_data.columns[j]))
  1537. # r.font.bold = True
  1538. # else:
  1539. # r = paragraph.add_run(str(table_6_data.iloc[i - 1, j]))
  1540. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1541. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1542. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1543. # r.font.size = Pt(10.5)
  1544. # r.font.name = 'Times New Roman'
  1545. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1546. doc.add_heading('三、数据合理性审核', level=1)
  1547. long_text4 = """
  1548. 明确数据审核原则,结合外业调查采样,获取的成土环境、土壤利用现状等信息对结果进行综合评价。通过阈值分析、关联分析、逻辑分析等方法对数据准确性进行判断。
  1549. 阈值法(国家和省级数据阈值):结合区域历史数据建立阈值,平台利用阈值法(国家和省级数据值)自动对检测数据进行初步审核,并对超出阈值范围数据做出警示标识,专家或专业技术人员结合区域实际、专家经验判定异常值并对异常数据进行驳回。超出阈值颜色标注。
  1550. 红色: 超出国家阈值,维持试点期间的标红。
  1551. 黄色: 省级阈值在国家阈值范围内的,数据超出省级阈值标黄。
  1552. 紫色: 省级阈值超出国家阈值的,数据超出省级阈值标成紫色(注,此种情况超国家阈值的红色服从紫色,仅标紫色)
  1553. 极值法: 常用的统计量是均值、标准差、最大值、最小值、分位数等,用来判断是否超出了合理的极值范围。根据相关指标历年数据与指标最大值、最小值、平均数、中位数和极差进行审查,结合相关外业情况。
  1554. 关联分析方法: 存在量化关系的指标,通过设定组合筛选异常值,如碳氮比等关联分析。
  1555. 指标综合分析:根据指标相互之间的关系,如有效磷在全磷中的占比、全钾与速效钾缓效钾之和的关系等。有机质、全磷、有效磷、全钾等数据异常; 全氮和有机质之间关系不合理; 速效钾含量远大于缓效钾,盐基总量远大于阳离子交换量; 部分样品阳离子交换量和交换性盐基总量测定结果偏低; 水溶盐离子总量与全盐量的相对偏差已远超过方法规定的允差范围; 容重检测偏差比较大;水稳性大团聚体土壤于燥结块,影响测定结果、重金属按照风险筛选值和风险管控值等问题。
  1556. 数据质量溯源:异常数据溯源,可能是内业测试化验环节问题,也有可能是外业调查采样问题,要结合数据检测和异常复检情况具体判断。
  1557. """
  1558. para = doc.add_paragraph(long_text4)
  1559. run1 = para.runs[0]
  1560. run1.font.name = '宋体' # 设置字体为宋体
  1561. run1.font.size = Pt(11) # 设置字号为11磅
  1562. doc.add_heading('1、阈值法审核', level=2)
  1563. # 插入表格
  1564. paragraph_7 = doc.add_paragraph()
  1565. paragraph_7.add_run(f'表6:{areaName}土壤检测数据超阈值样品统计表').bold = True
  1566. # table_7 = doc.add_table(rows=2, cols=2)
  1567. # paragraph_7.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1568. # table_7.alignment = WD_TABLE_ALIGNMENT.CENTER
  1569. # 写入数据 点击查看数据 这里也不一定写的下 最好是嵌入链接
  1570. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  1571. # todo 合并所有数据 审核结果不为空的数据 写入表格保存到指定文件夹
  1572. doc.add_heading('2、极值法审核', level=2)
  1573. doc.add_heading('(1)pH', level=3)
  1574. # 插入ph分布图
  1575. if os.path.isfile(f'{mkdir_path}/pH值分布图.png'):
  1576. doc.add_picture(f'{mkdir_path}/pH值分布图.png', width=Inches(6.0))
  1577. paragraph_t_1 = doc.add_paragraph()
  1578. paragraph_t_1.add_run(f'图1:pH值分布情况').bold = True
  1579. paragraph_t_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1580. # 插入频度统计表
  1581. paragraph_8 = doc.add_paragraph()
  1582. paragraph_8.add_run('表7:pH数据统计表').bold = True
  1583. table_8 = doc.add_table(rows=6, cols=2, style='Light Shading Accent 1')
  1584. t_8 = table_8_data['频度分析']
  1585. t_8 = t_8.reset_index()
  1586. t_8.columns = ['指标', '数据']
  1587. paragraph_8.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1588. table_8.alignment = WD_TABLE_ALIGNMENT.CENTER
  1589. for i, row in enumerate(table_8.rows):
  1590. for j, cell in enumerate(row.cells):
  1591. # 获取单元格中的段落对象
  1592. paragraph = cell.paragraphs[0]
  1593. if i == 0:
  1594. r = paragraph.add_run(str(t_8.columns[j]))
  1595. r.font.bold = True
  1596. else:
  1597. r = paragraph.add_run(str(t_8.iloc[i - 1, j]))
  1598. r.font.size = Pt(10.5)
  1599. r.font.name = 'Times New Roman'
  1600. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1601. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1602. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1603. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1604. # 插入异常数据提取表格 todo 这里数据多的话也可能写不下 最好是嵌入一下
  1605. if not table_8_data['异常数据'].empty:
  1606. paragraph_9 = doc.add_paragraph()
  1607. paragraph_9.add_run('表8:pH异常数据统计表').bold = True
  1608. table_9 = doc.add_table(rows=len(table_8_data['异常数据']) + 1, cols=6, style='Light Shading Accent 1')
  1609. t_9 = table_8_data['异常数据']
  1610. paragraph_9.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1611. table_9.alignment = WD_TABLE_ALIGNMENT.CENTER
  1612. for i, row in enumerate(table_9.rows):
  1613. for j, cell in enumerate(row.cells):
  1614. # 获取单元格中的段落对象
  1615. paragraph = cell.paragraphs[0]
  1616. if i == 0:
  1617. r = paragraph.add_run(str(t_9.columns[j]))
  1618. r.font.bold = True
  1619. else:
  1620. r = paragraph.add_run(str(t_9.iloc[i - 1, j]))
  1621. r.font.size = Pt(10.5)
  1622. r.font.name = 'Times New Roman'
  1623. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1624. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1625. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1626. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1627. doc.add_heading('3、指标综合分析', level=2)
  1628. # 阳离子交换量与交换性盐总量关系
  1629. if os.path.isfile(f'{mkdir_path}/阳离子交换量与交换性盐基总量相关性散点图.png'):
  1630. doc.add_picture(f'{mkdir_path}/阳离子交换量与交换性盐基总量相关性散点图.png', width=Inches(6.0))
  1631. paragraph_t_8 = doc.add_paragraph()
  1632. paragraph_t_8.add_run(f'图8:阳离子交换量与交换性盐基总量相关性散点图').bold = True
  1633. paragraph_t_8.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1634. # 交换性盐总量与交换性盐相关关系
  1635. if os.path.isfile(f'{mkdir_path}/交换性盐基总量与交换性盐相关关系(pH小于等于7.5).png'):
  1636. doc.add_picture(f'{mkdir_path}/交换性盐基总量与交换性盐相关关系(pH小于等于7.5).png', width=Inches(6.0))
  1637. paragraph_t_9 = doc.add_paragraph()
  1638. paragraph_t_9.add_run(f'图9:交换性盐基总量和交换性钙镁钠钾分项指标关系(pH≤7.5)').bold = True
  1639. paragraph_t_9.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1640. if os.path.isfile(f'{mkdir_path}/交换性盐基总量与交换性盐相关关系(pH大于7.5).png'):
  1641. doc.add_picture(f'{mkdir_path}/交换性盐基总量与交换性盐相关关系(pH大于7.5).png', width=Inches(6.0))
  1642. paragraph_t_10 = doc.add_paragraph()
  1643. paragraph_t_10.add_run(f'图10:交换性盐基总量和交换性钙镁钠钾分项指标关系(pH大于7.5)').bold = True
  1644. paragraph_t_10.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1645. # 水溶性盐、电导率、离子总量
  1646. if os.path.isfile(f'{mkdir_path}/全盐量分布图.png'):
  1647. doc.add_picture(f'{mkdir_path}/全盐量分布图.png', width=Inches(6.0))
  1648. paragraph_t_11 = doc.add_paragraph()
  1649. paragraph_t_11.add_run(f'图11:全盐量分布图').bold = True
  1650. paragraph_t_11.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1651. if os.path.isfile(f'{mkdir_path}/全盐量与电导率相关性散点图.png'):
  1652. doc.add_picture(f'{mkdir_path}/全盐量与电导率相关性散点图.png', width=Inches(6.0))
  1653. paragraph_t_12 = doc.add_paragraph()
  1654. paragraph_t_12.add_run(f'图12:全盐量与电导率相关性散点图').bold = True
  1655. paragraph_t_12.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1656. if os.path.isfile(f'{mkdir_path}/离子总量与水溶性盐总量关系图.png'):
  1657. doc.add_picture(f'{mkdir_path}/离子总量与水溶性盐总量关系图.png', width=Inches(6.0))
  1658. paragraph_t_13 = doc.add_paragraph()
  1659. paragraph_t_13.add_run(f'图13:水溶性盐总量与离子总量关系分析图').bold = True
  1660. paragraph_t_13.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1661. doc.add_heading('四、审核存疑数据', level=1)
  1662. paragraph_12 = doc.add_paragraph()
  1663. paragraph_12.add_run(f'表9:数据审核过程存疑数据一览表').bold = True
  1664. paragraph_12.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1665. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  1666. doc.add_heading('五、附表', level=1)
  1667. doc.add_heading('附表1:某区三普样品数量统计表(表层)', level=2)
  1668. # 插入附表1
  1669. table_1_f = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  1670. table_1_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  1671. # 遍历表格 插入数据
  1672. # 遍历表格的所有单元格,并填充内容
  1673. for i, row in enumerate(table_1_f.rows):
  1674. for j, cell in enumerate(row.cells):
  1675. # 获取单元格中的段落对象
  1676. paragraph = cell.paragraphs[0]
  1677. if i == 0:
  1678. r = paragraph.add_run(str(table_1_data.columns[j]))
  1679. r.font.bold = True
  1680. else:
  1681. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  1682. r.font.size = Pt(10.5)
  1683. r.font.name = 'Times New Roman'
  1684. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1685. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1686. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1687. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1688. # 合并单元格 合并第3列的第二行和第三行
  1689. if lenNum_1 > 1:
  1690. table_1_f.cell(2, 2).text = ''
  1691. table_1_f.cell(1, 2).merge(table_1_f.cell(2, 2))
  1692. doc.add_heading('附表2:各指标频度分析表', level=2)
  1693. # 插入表格 写入数据
  1694. table_f_2_data = table_f_2_data.replace(np.nan, '')
  1695. makeInfoTable(table_f_2_data, doc)
  1696. # table_f_2 = doc.add_table(rows=len(table_f_2_data) + 1, cols=6, style='Light Shading Accent 1')
  1697. # for i, row in enumerate(table_f_2.rows):
  1698. # for j, cell in enumerate(row.cells):
  1699. # # 获取单元格中的段落对象
  1700. # paragraph = cell.paragraphs[0]
  1701. # if i == 0:
  1702. # r = paragraph.add_run(str(table_f_2_data.columns[j]))
  1703. # r.font.bold = True
  1704. # else:
  1705. # r = paragraph.add_run(str(table_f_2_data.iloc[i - 1, j]))
  1706. # r.font.size = Pt(10.5)
  1707. # r.font.name = 'Times New Roman'
  1708. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1709. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1710. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1711. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1712. # doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:频度分析表.xlsx', level=4)
  1713. doc.add_heading('附表3:各指标频度分析图', level=2)
  1714. # 插入频度信息的图形
  1715. if os.path.isfile(f'{mkdir_path}/pH分析图.png'):
  1716. doc.add_picture(f'{mkdir_path}/pH分析图.png', width=Inches(6.0))
  1717. if os.path.isfile(f'{mkdir_path}/电导率分析图.png'):
  1718. doc.add_picture(f'{mkdir_path}/电导率分析图.png', width=Inches(6.0))
  1719. if os.path.isfile(f'{mkdir_path}/交换性钙分析图.png'):
  1720. doc.add_picture(f'{mkdir_path}/交换性钙分析图.png', width=Inches(6.0))
  1721. if os.path.isfile(f'{mkdir_path}/交换性钾分析图.png'):
  1722. doc.add_picture(f'{mkdir_path}/交换性钾分析图.png', width=Inches(6.0))
  1723. if os.path.isfile(f'{mkdir_path}/交换性镁分析图.png'):
  1724. doc.add_picture(f'{mkdir_path}/交换性镁分析图.png', width=Inches(6.0))
  1725. if os.path.isfile(f'{mkdir_path}/交换性钠分析图.png'):
  1726. doc.add_picture(f'{mkdir_path}/交换性钠分析图.png', width=Inches(6.0))
  1727. if os.path.isfile(f'{mkdir_path}/交换性盐基总量分析图.png'):
  1728. doc.add_picture(f'{mkdir_path}/交换性盐基总量分析图.png', width=Inches(6.0))
  1729. if os.path.isfile(f'{mkdir_path}/全盐量分析图.png'):
  1730. doc.add_picture(f'{mkdir_path}/全盐量分析图.png', width=Inches(6.0))
  1731. if os.path.isfile(f'{mkdir_path}/阳离子交换量分析图.png'):
  1732. doc.add_picture(f'{mkdir_path}/阳离子交换量分析图.png', width=Inches(6.0))
  1733. doc.add_heading('附表4:数值修约标准', level=2)
  1734. # 读取数据 插入表格 写入数据
  1735. numData = pd.read_excel('./img/数值修约要求.xlsx', sheet_name='Sheet1')
  1736. table_2_f = doc.add_table(rows=len(numData) + 1, cols=2, style='Light Shading Accent 1')
  1737. table_2_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  1738. for i, row in enumerate(table_2_f.rows):
  1739. for j, cell in enumerate(row.cells):
  1740. # 获取单元格中的段落对象
  1741. paragraph = cell.paragraphs[0]
  1742. if i == 0:
  1743. r = paragraph.add_run(str(numData.columns[j]))
  1744. r.font.bold = True
  1745. else:
  1746. r = paragraph.add_run(str(numData.iloc[i - 1, j]))
  1747. r.font.size = Pt(10.5)
  1748. r.font.name = 'Times New Roman'
  1749. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1750. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1751. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1752. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1753. # 处理样式 遍历所有的段落 修改字体
  1754. # 遍历并打印每个段落的文本
  1755. paragraphs = doc.paragraphs
  1756. for paragraph in paragraphs:
  1757. for run in paragraph.runs:
  1758. run.font.color.rgb = RGBColor(0, 0, 0)
  1759. run.font.name = 'Times New Roman'
  1760. run.font.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1761. # run.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1762. # 保存Word文档
  1763. doc.save(f'{mkdir_path}/{areaName}审核报告.docx')
  1764. # 生成重金属指标审核报告
  1765. def getHeavyMetalIndicators(originData, data, type, changeFileUrl, saveFileUrl, check_1_data,
  1766. check_3_data,
  1767. check_5_data,
  1768. check_8_data, # 样品编号替换为编号
  1769. check_10_data,
  1770. check_12_data,
  1771. check_14_data):
  1772. # 生成报告
  1773. name = os.path.basename(changeFileUrl)
  1774. n = name.split('.')
  1775. areaName = n[0].replace('数据', '')
  1776. # 生成一个新的文件夹用于存放审核报告相关的数据
  1777. nowTime = time.strftime("%Y-%m-%d %H时%M分%S秒", time.localtime())
  1778. dir_name = f'{areaName}-{type}数据审核报告'
  1779. mkdir_path = saveFileUrl + '/' + dir_name + nowTime
  1780. if not os.path.exists(mkdir_path):
  1781. os.mkdir(mkdir_path)
  1782. heavyMetaData = data[indexClassificationList[type]]
  1783. heavyMetaDataNum = originData[indexClassificationList[type]]
  1784. report.getFrequencyImage(heavyMetaData, mkdir_path)
  1785. heavyMetaData['序号'] = data['序号']
  1786. heavyMetaData['原样品编号'] = data['原样品编号']
  1787. heavyMetaData['样品编号'] = data['样品编号']
  1788. heavyMetaData['地理位置'] = data['地理位置']
  1789. heavyMetaData['母质'] = data['母质']
  1790. heavyMetaData['土壤类型'] = data['土壤类型']
  1791. heavyMetaData['土地利用类型'] = data['土地利用类型']
  1792. # heavyMetaData['土壤质地'] = data['土壤质地']
  1793. heavyMetaData['原样品编号'] = heavyMetaData['原样品编号'].astype(str)
  1794. # checkData = pd.read_excel(changeFileUrl, sheet_name='检测方法')
  1795. heavyMetaDataNum['序号'] = originData['序号']
  1796. heavyMetaDataNum['原样品编号'] = originData['原样品编号']
  1797. heavyMetaDataNum['样品编号'] = originData['样品编号']
  1798. heavyMetaDataNum['地理位置'] = originData['地理位置']
  1799. heavyMetaDataNum['母质'] = originData['母质']
  1800. heavyMetaDataNum['土壤类型'] = originData['土壤类型']
  1801. heavyMetaDataNum['土地利用类型'] = originData['土地利用类型']
  1802. # heavyMetaData['土壤质地'] = data['土壤质地']
  1803. heavyMetaDataNum['原样品编号'] = heavyMetaDataNum['原样品编号'].astype(str)
  1804. # 上面这个地址,可以纯递给函数中,用于保存表格和图片
  1805. # 调用函数 开始生成报告相关内容
  1806. # 表1相关数据
  1807. typeData = report.getSimpleNum(heavyMetaData)
  1808. lenNum_1 = len(typeData['sData'])
  1809. lenNum_1_f = len(typeData['allData'])
  1810. table_1_data = pd.DataFrame({
  1811. '类型': typeData['sData'].index,
  1812. '数量': typeData['sData'],
  1813. '合计': [typeData['sData'].sum() for _ in range(lenNum_1)]
  1814. })
  1815. # 表2数据
  1816. table_2_data = report.getDataComplete(heavyMetaData)
  1817. table_2_data = table_2_data.reset_index()
  1818. table_2_data.columns = ['指标名称', '实测数量', '应测数量']
  1819. # 表3数据
  1820. # table_3_data = report.checkMethod(checkData, mkdir_path)
  1821. # 数据修约 表4
  1822. report.getNum(heavyMetaDataNum, mkdir_path)
  1823. # 数据填报项审核 表5
  1824. report.dataReportResult(heavyMetaData, mkdir_path)
  1825. # 表6数据 土壤质地类型不一致
  1826. middData = heavyMetaData[['原样品编号', '样品编号']].astype(str)
  1827. middData['编号'] = middData['原样品编号']
  1828. del middData['原样品编号']
  1829. check_1_data = pd.merge(check_1_data, middData, how='left', on='编号')
  1830. check_1_data = check_1_data.replace(np.nan, '')
  1831. # typeNotSame = check_1_data[check_1_data['土壤质地'] != check_1_data['土壤类型(判断)']]
  1832. # table_6_data = typeNotSame[['编号', '样品编号', '土壤质地', '土壤类型(判断)']]
  1833. allNeedData = pd.DataFrame({})
  1834. allNeedData['原样品编号'] = check_1_data['编号']
  1835. getSimpleDataNumber = pd.merge(allNeedData, heavyMetaData[['原样品编号', '样品编号']], how='left', on="原样品编号")
  1836. allNeedData['样品编号'] = getSimpleDataNumber['样品编号']
  1837. allNeedData['土地利用类型'] = check_1_data['土地利用类型']
  1838. allNeedData['审核结果'] = check_14_data['审核结果']
  1839. allNeedData['外业'] = ['' for _ in range(len(check_1_data))]
  1840. table_7_data = allNeedData[allNeedData['审核结果'] != '']
  1841. del table_7_data['审核结果']
  1842. # 写进表格
  1843. with pd.ExcelWriter(f'{mkdir_path}/超阈值样品统计表.xlsx', engine='openpyxl') as writer:
  1844. table_7_data.to_excel(writer, index=False, sheet_name='超阈值数据')
  1845. # 表8数据
  1846. table_8_data = report.getPHData(heavyMetaData, mkdir_path)
  1847. # 表12数据 重金属超标
  1848. caOverData = pd.merge(check_1_data[['编号', '土地利用类型']], check_14_data[
  1849. ['编号', 'pH', '镉mg/kg', '汞mg/kg', '砷mg/kg', '铅mg/kg', '铬mg/kg', '镍mg/kg', '审核结果']], how='outer',
  1850. on=['编号'])
  1851. caOverData['原样品编号'] = caOverData['编号']
  1852. caOverData = pd.merge(caOverData, heavyMetaData[['原样品编号', '样品编号']], how='left', on='原样品编号')
  1853. first_column = caOverData.pop('样品编号')
  1854. caOverData.insert(0, '样品编号', first_column)
  1855. caOverData_need = caOverData[caOverData['审核结果'] != '']
  1856. # 写进表格
  1857. with pd.ExcelWriter(f'{mkdir_path}/重金属超筛选值情况统计.xlsx', engine='openpyxl') as writer:
  1858. caOverData_need.to_excel(writer, index=False, sheet_name='重金属超筛选值情况统计')
  1859. # 表13 所有存疑数据
  1860. with pd.ExcelWriter(f'{mkdir_path}/数据审核过程存疑数据一览表.xlsx', engine='openpyxl') as writer:
  1861. allNeedData[allNeedData['审核结果'] != ''].to_excel(writer, index=False, sheet_name='存疑数据')
  1862. # 附表: 频度分析图
  1863. # report.getFrequencyImage(heavyMetaData, mkdir_path)
  1864. table_f_2_data = report.getFrequencyInformation(data, mkdir_path)
  1865. # 新建一个文档
  1866. doc = Document()
  1867. # 添加标题
  1868. doc.add_heading(f"{areaName}第三次全国土壤普查重金属指标检测数据审核报告", level=0)
  1869. # 在文档中添加封面段落
  1870. fm = doc.add_paragraph()
  1871. fm = doc.add_paragraph()
  1872. fm = doc.add_paragraph()
  1873. fm = doc.add_paragraph()
  1874. fm = doc.add_paragraph()
  1875. # 插入图片,设置宽度为6英寸(可根据需求调整)
  1876. run = fm.add_run()
  1877. run.add_picture('img/第三次全国土壤普查img.png', width=Inches(2.26))
  1878. fm.alignment = WD_TABLE_ALIGNMENT.CENTER
  1879. # 在文档中添加封面段落
  1880. fm = doc.add_paragraph()
  1881. fm = doc.add_paragraph()
  1882. fm = doc.add_paragraph()
  1883. fm = doc.add_paragraph()
  1884. fm = doc.add_paragraph()
  1885. fm = doc.add_paragraph()
  1886. # 获取当前日期
  1887. current_date = datetime.now()
  1888. # 将年份和月份转换为中文大写数字
  1889. year = int(current_date.strftime("%Y")) # 转换为整数
  1890. month = int(current_date.strftime("%m")) # 转换为整数
  1891. # 使用 cn2an 将数字转换为中文大写
  1892. year_chinese = number_to_chinese_year(year) # 年份转换
  1893. month_chinese = cn2an.an2cn(month) # 月份转换
  1894. current_date_formatted = f"{year_chinese}年{month_chinese}月"
  1895. # 组合动态文本
  1896. dynamic_text = f"安徽农业大学资源与环境学院\n{current_date_formatted}"
  1897. # 添加文字并居中
  1898. text_paragraph = doc.add_paragraph()
  1899. text_run = text_paragraph.add_run(dynamic_text)
  1900. text_run.font.name = "宋体"
  1901. text_run.font.size = Pt(18)
  1902. text_run.bold = True # 设置字体加粗
  1903. text_paragraph.alignment = 1 # 1 表示居中对齐
  1904. # 正确插入分页符
  1905. doc.add_page_break()
  1906. heading = doc.add_heading('总体概述', level=1)
  1907. heading.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1908. # 第一段
  1909. long_text1 = f"""
  1910. {areaName}第三次全国土壤普查县级数据审核报告主要通过收集和整理相关数据,并对其进行内业检测数据的完整性、规范性和合理性进行审核,形成存疑样点清单及存疑样点结果判定,最终编制完成数据审核报告,同时提交( )对相关指标进行整改复测。报告整理了( )个表层样品数据(含平行样、质控样)、( )个水稳性大团聚体样品数据(含平行样)、( )个剖面样品数据(含平行样、质控样),共( )次样品检测结果分析情况。相关结果分别按照物理性指标检测数据、一般化学指标检测数据、常规养分指标检测数据和重金属指标检测数据形成四份报告。本报告为表层样常规养分指标检测数据审核报告。
  1911. """
  1912. para0 = doc.add_paragraph(long_text1)
  1913. run0 = para0.runs[0] # 获取段落中的第一个run对象
  1914. run0.font.name = '宋体' # 设置字体为宋体
  1915. run0.font.size = Pt(11) # 设置字号为11磅
  1916. # 设置段落的行间距为1.5倍
  1917. para_format = para0.paragraph_format
  1918. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  1919. # 添加一级标题
  1920. doc.add_heading('一、数据完整性审核', level=1)
  1921. # 第二段
  1922. long_text2 = """
  1923. 外业信息调查采样环节:采用电子围栏和外业调查采样APP,对采样位置和填报信息进行管理,确保外业调查信息填报完整。
  1924. 样品检测数据上报环节:通过土壤普查工作平台对上报数据的完整性进行筛查。( )第三次土壤普查相关指标检测数据由( )提供,数据均已通过省级质控实验室和县级土壤普查办审核;相关土壤指标历史数据则由( )第三次土壤普查办公室提供。根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》要求,统计各土地利用类型的样品数量,并按照耕地园地土壤样品(表层/剖面)、林地草地土壤样品(表层/剖面)以及水稳定性大团聚体样品(见表1)进行分类,编制了指标名称与实际检测样品数量统计表(见表2),其中水溶性盐分总量大于1g/kg,增加检测了八大离子(该指标在化学指标检测数据审核报告内)。
  1925. """
  1926. para = doc.add_paragraph(long_text2)
  1927. run1 = para.runs[0]
  1928. run1.font.name = '宋体' # 设置字体为宋体
  1929. run1.font.size = Pt(11) # 设置字号为11磅
  1930. # 设置段落的行间距为1.5倍
  1931. para_format = para.paragraph_format
  1932. para_format.line_spacing = 1.5 # 设置行间距为1.5倍
  1933. doc.add_heading('1、土地利用类型与检测指标符合性审核', level=2)
  1934. # 插入表格1
  1935. paragraph_1 = doc.add_paragraph()
  1936. paragraph_1.add_run(f"表1:{areaName}三普样品数量统计表(表层)").bold = True
  1937. # 设置居中
  1938. paragraph_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1939. table_1 = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  1940. table_1.alignment = WD_TABLE_ALIGNMENT.CENTER
  1941. # 遍历表格 插入数据
  1942. # 遍历表格的所有单元格,并填充内容
  1943. for i, row in enumerate(table_1.rows):
  1944. for j, cell in enumerate(row.cells):
  1945. # 获取单元格中的段落对象
  1946. paragraph = cell.paragraphs[0]
  1947. if i == 0:
  1948. r = paragraph.add_run(str(table_1_data.columns[j]))
  1949. r.font.bold = True
  1950. else:
  1951. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  1952. r.font.size = Pt(10.5)
  1953. r.font.name = 'Times New Roman'
  1954. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1955. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1956. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1957. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1958. # 合并单元格 合并第3列的第二行和第三行
  1959. if lenNum_1 > 1:
  1960. table_1.cell(2, 2).text = ''
  1961. table_1.cell(1, 2).merge(table_1.cell(2, 2))
  1962. ############test##############
  1963. doc.add_heading('2、指标名称与实际检测样品数量完整性审核', level=2)
  1964. # 插入表格2
  1965. paragraph_2 = doc.add_paragraph()
  1966. paragraph_2.add_run(f'表2:{areaName}指标名称与实际检测样品数量统计表').bold = True
  1967. table_2 = doc.add_table(rows=len(table_2_data) + 1, cols=3, style='Light Shading Accent 1')
  1968. paragraph_2.alignment = WD_ALIGN_PARAGRAPH.CENTER
  1969. table_2.alignment = WD_TABLE_ALIGNMENT.CENTER
  1970. for i, row in enumerate(table_2.rows):
  1971. for j, cell in enumerate(row.cells):
  1972. # 获取单元格中的段落对象
  1973. paragraph = cell.paragraphs[0]
  1974. if i == 0:
  1975. r = paragraph.add_run(str(table_2_data.columns[j]))
  1976. r.font.bold = True
  1977. else:
  1978. r = paragraph.add_run(str(table_2_data.iloc[i - 1, j]))
  1979. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  1980. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  1981. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  1982. r.font.size = Pt(10.5)
  1983. r.font.name = 'Times New Roman'
  1984. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  1985. doc.add_heading('二、数据规范性审核', level=1)
  1986. long_text3 = """
  1987. 按照《第三次全国土壤普查暂行土壤分类系统 (试行)》、《第三次全国土壤普查工作底图制作与采样点布设技术规范》、《第三次全国土壤普查土壤类型图编制技术规范》《第三次全国土壤普查土壤样品制备与检测技术规范》等规范统一标准和表现形式,土地利用方式按照第三次国土调查土地利用信息统一,种植制度按照农业区划信息进行统一。三普工作平台同时内置指标量纲、数字修约和允差等,控制数据规范性。
  1988. 根据《第三次全国土壤普查土壤样品制备与检测技术规范(修订版)》,对检测指标对应的检测方法与相关标准或规范进行审核,得到检测方法审核、数值修约审核、数据填报项审核结果,未检出项填报以检出限的一半上报并加注*号。根据土壤普查教材中机械组成分类参考表,并进行宁国土壤质地填报审核结果表(见表6)。
  1989. """
  1990. para = doc.add_paragraph(long_text3)
  1991. run1 = para.runs[0]
  1992. run1.font.name = '宋体' # 设置字体为宋体
  1993. run1.font.size = Pt(11) # 设置字号为11磅
  1994. doc.add_heading('1、数据填报规范性审核', level=2)
  1995. doc.add_heading('1、数据填报规范性审核', level=2)
  1996. # 插入表3
  1997. paragraph_3 = doc.add_paragraph()
  1998. paragraph_3.add_run(f'表3:{areaName}土壤检测数据检测方法填报审核结果表').bold = True
  1999. # table_3 = doc.add_table(rows=2, cols=2)
  2000. paragraph_3.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2001. # table_3.alignment = WD_TABLE_ALIGNMENT.CENTER
  2002. # 写入数据 这里数据写不下 嵌入链接
  2003. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:检测方法审核结果.xlsx', level=4)
  2004. doc.add_heading('2、数值修约规范性审核', level=2)
  2005. # 插入表4
  2006. paragraph_4 = doc.add_paragraph()
  2007. paragraph_4.add_run(f'表4:{areaName}土壤检测数据数值修约结果表').bold = True
  2008. # table_4 = doc.add_table(rows=2, cols=2)
  2009. paragraph_4.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2010. # table_4.alignment = WD_TABLE_ALIGNMENT.CENTER
  2011. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数值修约审核.xlsx', level=4)
  2012. # 填入数据 这里数据也放不下 嵌入链接
  2013. doc.add_heading('3、数据未检出的填报规范性审核', level=2)
  2014. # 插入表5
  2015. paragraph_5 = doc.add_paragraph()
  2016. paragraph_5.add_run(f'表5:{areaName}土壤检测数据未检出项填报审核结果表').bold = True
  2017. # table_5 = doc.add_table(rows=2, cols=2)
  2018. paragraph_5.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2019. # table_5.alignment = WD_TABLE_ALIGNMENT.CENTER
  2020. # 写入数据 这里数据也放不下 嵌入链接
  2021. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据填报项审核结果.xlsx', level=4)
  2022. # doc.add_heading('4、土壤质地填报规范性审核', level=2)
  2023. # 插入表6
  2024. # paragraph_6 = doc.add_paragraph()
  2025. # paragraph_6.add_run(f'表6:{areaName}土壤质地填报审核结果表').bold = True
  2026. # table_6 = doc.add_table(rows=len(table_6_data) + 1, cols=4, style='Light Shading Accent 1')
  2027. # paragraph_6.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2028. # table_6.alignment = WD_TABLE_ALIGNMENT.CENTER
  2029. # # 提取结果表中数据
  2030. # # 写入数据 土壤质地类型不一致的数据提取出来
  2031. # for i, row in enumerate(table_6.rows):
  2032. # for j, cell in enumerate(row.cells):
  2033. # # 获取单元格中的段落对象
  2034. # paragraph = cell.paragraphs[0]
  2035. # if i == 0:
  2036. # r = paragraph.add_run(str(table_6_data.columns[j]))
  2037. # r.font.bold = True
  2038. # else:
  2039. # r = paragraph.add_run(str(table_6_data.iloc[i - 1, j]))
  2040. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2041. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2042. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2043. # r.font.size = Pt(10.5)
  2044. # r.font.name = 'Times New Roman'
  2045. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2046. doc.add_heading('三、数据合理性审核', level=1)
  2047. long_text4 = """
  2048. 明确数据审核原则,结合外业调查采样,获取的成土环境、土壤利用现状等信息对结果进行综合评价。通过阈值分析、关联分析、逻辑分析等方法对数据准确性进行判断。
  2049. 阈值法(国家和省级数据阈值):结合区域历史数据建立阈值,平台利用阈值法(国家和省级数据值)自动对检测数据进行初步审核,并对超出阈值范围数据做出警示标识,专家或专业技术人员结合区域实际、专家经验判定异常值并对异常数据进行驳回。超出阈值颜色标注。
  2050. 红色: 超出国家阈值,维持试点期间的标红。
  2051. 黄色: 省级阈值在国家阈值范围内的,数据超出省级阈值标黄。
  2052. 紫色: 省级阈值超出国家阈值的,数据超出省级阈值标成紫色(注,此种情况超国家阈值的红色服从紫色,仅标紫色)
  2053. 极值法: 常用的统计量是均值、标准差、最大值、最小值、分位数等,用来判断是否超出了合理的极值范围。根据相关指标历年数据与指标最大值、最小值、平均数、中位数和极差进行审查,结合相关外业情况。
  2054. 关联分析方法: 存在量化关系的指标,通过设定组合筛选异常值,如碳氮比等关联分析。
  2055. 指标综合分析:根据指标相互之间的关系,如有效磷在全磷中的占比、全钾与速效钾缓效钾之和的关系等。有机质、全磷、有效磷、全钾等数据异常; 全氮和有机质之间关系不合理; 速效钾含量远大于缓效钾,盐基总量远大于阳离子交换量; 部分样品阳离子交换量和交换性盐基总量测定结果偏低; 水溶盐离子总量与全盐量的相对偏差已远超过方法规定的允差范围; 容重检测偏差比较大;水稳性大团聚体土壤于燥结块,影响测定结果、重金属按照风险筛选值和风险管控值等问题。
  2056. 数据质量溯源:异常数据溯源,可能是内业测试化验环节问题,也有可能是外业调查采样问题,要结合数据检测和异常复检情况具体判断。
  2057. """
  2058. para = doc.add_paragraph(long_text4)
  2059. run1 = para.runs[0]
  2060. run1.font.name = '宋体' # 设置字体为宋体
  2061. run1.font.size = Pt(11) # 设置字号为11磅
  2062. doc.add_heading('1、阈值法审核', level=2)
  2063. # 插入表格
  2064. paragraph_7 = doc.add_paragraph()
  2065. paragraph_7.add_run(f'表6:{areaName}土壤检测数据超阈值样品统计表').bold = True
  2066. # table_7 = doc.add_table(rows=2, cols=2)
  2067. # paragraph_7.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2068. # table_7.alignment = WD_TABLE_ALIGNMENT.CENTER
  2069. # 写入数据 点击查看数据 这里也不一定写的下 最好是嵌入链接
  2070. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  2071. # todo 合并所有数据 审核结果不为空的数据 写入表格保存到指定文件夹
  2072. doc.add_heading('2、极值法审核', level=2)
  2073. doc.add_heading('(1)pH', level=3)
  2074. # 插入ph分布图
  2075. if os.path.isfile(f'{mkdir_path}/pH值分布图.png'):
  2076. doc.add_picture(f'{mkdir_path}/pH值分布图.png', width=Inches(6.0))
  2077. paragraph_t_1 = doc.add_paragraph()
  2078. paragraph_t_1.add_run(f'图1:pH值分布情况').bold = True
  2079. paragraph_t_1.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2080. # 插入频度统计表
  2081. paragraph_8 = doc.add_paragraph()
  2082. paragraph_8.add_run('表7:pH数据统计表').bold = True
  2083. table_8 = doc.add_table(rows=6, cols=2, style='Light Shading Accent 1')
  2084. t_8 = table_8_data['频度分析']
  2085. t_8 = t_8.reset_index()
  2086. t_8.columns = ['指标', '数据']
  2087. paragraph_8.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2088. table_8.alignment = WD_TABLE_ALIGNMENT.CENTER
  2089. for i, row in enumerate(table_8.rows):
  2090. for j, cell in enumerate(row.cells):
  2091. # 获取单元格中的段落对象
  2092. paragraph = cell.paragraphs[0]
  2093. if i == 0:
  2094. r = paragraph.add_run(str(t_8.columns[j]))
  2095. r.font.bold = True
  2096. else:
  2097. r = paragraph.add_run(str(t_8.iloc[i - 1, j]))
  2098. r.font.size = Pt(10.5)
  2099. r.font.name = 'Times New Roman'
  2100. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2101. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2102. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2103. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2104. # 插入异常数据提取表格 todo 这里数据多的话也可能写不下 最好是嵌入一下
  2105. if not table_8_data['异常数据'].empty:
  2106. paragraph_9 = doc.add_paragraph()
  2107. paragraph_9.add_run('表8:pH异常数据统计表').bold = True
  2108. table_9 = doc.add_table(rows=len(table_8_data['异常数据']) + 1, cols=6, style='Light Shading Accent 1')
  2109. t_9 = table_8_data['异常数据']
  2110. paragraph_9.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2111. table_9.alignment = WD_TABLE_ALIGNMENT.CENTER
  2112. for i, row in enumerate(table_9.rows):
  2113. for j, cell in enumerate(row.cells):
  2114. # 获取单元格中的段落对象
  2115. paragraph = cell.paragraphs[0]
  2116. if i == 0:
  2117. r = paragraph.add_run(str(t_9.columns[j]))
  2118. r.font.bold = True
  2119. else:
  2120. r = paragraph.add_run(str(t_9.iloc[i - 1, j]))
  2121. r.font.size = Pt(10.5)
  2122. r.font.name = 'Times New Roman'
  2123. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2124. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2125. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2126. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2127. doc.add_heading('4、指标综合分析', level=2)
  2128. doc.add_heading('表9:重金属超筛选值情况统计', level=4)
  2129. # todo 获取重金属数据
  2130. doc.add_heading('四、审核存疑数据', level=1)
  2131. paragraph_12 = doc.add_paragraph()
  2132. paragraph_12.add_run(f'表10:数据审核过程存疑数据一览表').bold = True
  2133. paragraph_12.alignment = WD_ALIGN_PARAGRAPH.CENTER
  2134. doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:数据审核过程存疑数据一览表.xlsx', level=4)
  2135. doc.add_heading('五、附表', level=1)
  2136. doc.add_heading('附表1:某区三普样品数量统计表(表层)', level=2)
  2137. # 插入附表1
  2138. table_1_f = doc.add_table(rows=lenNum_1 + 1, cols=3, style='Light Shading Accent 1')
  2139. table_1_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  2140. # 遍历表格 插入数据
  2141. # 遍历表格的所有单元格,并填充内容
  2142. for i, row in enumerate(table_1_f.rows):
  2143. for j, cell in enumerate(row.cells):
  2144. # 获取单元格中的段落对象
  2145. paragraph = cell.paragraphs[0]
  2146. if i == 0:
  2147. r = paragraph.add_run(str(table_1_data.columns[j]))
  2148. r.font.bold = True
  2149. else:
  2150. r = paragraph.add_run(str(table_1_data.iloc[i - 1, j]))
  2151. r.font.size = Pt(10.5)
  2152. r.font.name = 'Times New Roman'
  2153. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2154. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2155. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2156. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2157. # 合并单元格 合并第3列的第二行和第三行
  2158. if lenNum_1 > 1:
  2159. table_1_f.cell(2, 2).text = ''
  2160. table_1_f.cell(1, 2).merge(table_1_f.cell(2, 2))
  2161. doc.add_heading('附表2:各指标频度分析表', level=2)
  2162. # 插入表格 写入数据
  2163. table_f_2_data = table_f_2_data.replace(np.nan, '')
  2164. makeInfoTable(table_f_2_data, doc)
  2165. # table_f_2 = doc.add_table(rows=len(table_f_2_data) + 1, cols=6, style='Light Shading Accent 1')
  2166. # for i, row in enumerate(table_f_2.rows):
  2167. # for j, cell in enumerate(row.cells):
  2168. # # 获取单元格中的段落对象
  2169. # paragraph = cell.paragraphs[0]
  2170. # if i == 0:
  2171. # r = paragraph.add_run(str(table_f_2_data.columns[j]))
  2172. # r.font.bold = True
  2173. # else:
  2174. # r = paragraph.add_run(str(table_f_2_data.iloc[i - 1, j]))
  2175. # r.font.size = Pt(10.5)
  2176. # r.font.name = 'Times New Roman'
  2177. # r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2178. # paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2179. # paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2180. # paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2181. # doc.add_heading('为避免数据量过多无法显示,请至数据保存文件夹中查看数据表:频度分析表.xlsx', level=4)
  2182. doc.add_heading('附表3:各指标频度分析图', level=2)
  2183. # 插入频度信息的图形
  2184. if os.path.isfile(f'{mkdir_path}/pH分析图.png'):
  2185. doc.add_picture(f'{mkdir_path}/pH分析图.png', width=Inches(6.0))
  2186. if os.path.isfile(f'{mkdir_path}/总镉分析图.png'):
  2187. doc.add_picture(f'{mkdir_path}/总镉分析图.png', width=Inches(6.0))
  2188. if os.path.isfile(f'{mkdir_path}/总铬分析图.png'):
  2189. doc.add_picture(f'{mkdir_path}/总铬分析图.png', width=Inches(6.0))
  2190. if os.path.isfile(f'{mkdir_path}/总汞分析图.png'):
  2191. doc.add_picture(f'{mkdir_path}/总汞分析图.png', width=Inches(6.0))
  2192. if os.path.isfile(f'{mkdir_path}/总镍分析图.png'):
  2193. doc.add_picture(f'{mkdir_path}/总镍分析图.png', width=Inches(6.0))
  2194. if os.path.isfile(f'{mkdir_path}/总砷分析图.png'):
  2195. doc.add_picture(f'{mkdir_path}/总砷分析图.png', width=Inches(6.0))
  2196. if os.path.isfile(f'{mkdir_path}/总铅分析图.png'):
  2197. doc.add_picture(f'{mkdir_path}/总铅分析图.png', width=Inches(6.0))
  2198. doc.add_heading('附表4:数值修约标准', level=2)
  2199. # 读取数据 插入表格 写入数据
  2200. numData = pd.read_excel('./img/数值修约要求.xlsx', sheet_name='Sheet1')
  2201. table_2_f = doc.add_table(rows=len(numData) + 1, cols=2, style='Light Shading Accent 1')
  2202. table_2_f.alignment = WD_TABLE_ALIGNMENT.CENTER
  2203. for i, row in enumerate(table_2_f.rows):
  2204. for j, cell in enumerate(row.cells):
  2205. # 获取单元格中的段落对象
  2206. paragraph = cell.paragraphs[0]
  2207. if i == 0:
  2208. r = paragraph.add_run(str(numData.columns[j]))
  2209. r.font.bold = True
  2210. else:
  2211. r = paragraph.add_run(str(numData.iloc[i - 1, j]))
  2212. r.font.size = Pt(10.5)
  2213. r.font.name = 'Times New Roman'
  2214. r.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2215. paragraph.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
  2216. paragraph.paragraph_format.alignment = WD_TABLE_ALIGNMENT.CENTER # 对齐
  2217. paragraph.paragraph_format.line_spacing = 1 # 段落行间距
  2218. # 处理样式 遍历所有的段落 修改字体
  2219. # 遍历并打印每个段落的文本
  2220. paragraphs = doc.paragraphs
  2221. for paragraph in paragraphs:
  2222. for run in paragraph.runs:
  2223. run.font.color.rgb = RGBColor(0, 0, 0)
  2224. run.font.name = 'Times New Roman'
  2225. run.font.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2226. # run.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')
  2227. # 保存Word文档
  2228. doc.save(f'{mkdir_path}/{areaName}-{type}审核报告.docx')
  2229. def number_to_chinese_year(number):
  2230. # 定义数字到中文大写的映射
  2231. chinese_numerals = {'0': '〇', '1': '一', '2': '二', '3': '三',
  2232. '4': '四', '5': '五', '6': '六', '7': '七',
  2233. '8': '八', '9': '九'}
  2234. # 将数字逐个字符转换为中文大写
  2235. return ''.join(chinese_numerals[digit] for digit in str(number))