国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

php實現html標簽閉合檢測與修復方法

2024-05-04 23:37:34
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了php實現html標簽閉合檢測與修復方法,可實現針對html標簽中結束標簽的檢測與補全功能,非常具有實用價值,需要的朋友可以參考下

本文實例講述了php實現html標簽閉合檢測與修復方法。分享給大家供大家參考。具體如下:

html標簽閉合檢測與修復,說的有點大 , 并沒有考慮的很完整,沒有使用正則表達式, 適用于html文件中只有開始標簽沒有結束標簽, 是有結束標簽沒有開始標簽的情況。標簽閉合的位置需要根據需求調整

 

 
  1. <?php 
  2. $str = ' 
  3. <div data="<li></li>"
  4. <img src="http://www.baidu.com/123123.png"/> 
  5. <div2> 
  6. <a>content</a> 
  7. </div2> 
  8. <ul> 
  9. <li> 
  10. </li> 
  11. </ul> 
  12. <p> 
  13. content full 
  14. </p> 
  15. this is content</test1> 
  16. this is content</test2> 
  17. <test4 data="liujinjing"> This is cont 
  18. <li></li> 
  19. <test3 data="liujinjing"> This is content 
  20. <div3> 
  21. </div3> 
  22. </div4> 
  23. </div> 
  24. </div> 
  25. <div6 style="width:90px; "this is content'; 
  26. $str_len = strlen($str); 
  27. //記錄起始標簽 
  28. $pre_data = array(); 
  29. //記錄起始標簽位置 
  30. $pre_pos = array(); 
  31. $last_data = array(); 
  32. $error_data = array(); 
  33. $error_pos = array(); 
  34. $i = 0; 
  35. //標記為 < 開始 
  36. $start_flag = false
  37. while( $i < $str_len ) { 
  38. if($str[$i]=="<" && $str[$i+1]!='/' && $str[$i+1]!='!') { 
  39. $i++; 
  40. $_tmp_str = ''
  41. //標記為 < 開始 
  42. $start_flag = true
  43. //標記空白 
  44. $space_flag = false
  45. while($str[$i]!=">" && $str[$i]!="'" && $str[$i]!='"' && $str[$i] !='/' && $i<$str_len){ 
  46. if($str[$i]==' ') { 
  47. $space_flag = true
  48. if(!$space_flag) { 
  49. $_tmp_str .= $str[$i];  
  50. $i++; 
  51. $pre_data[] = $_tmp_str; 
  52. $pre_pos[] = $i; 
  53. else if ($str[$i]=="<" && $str[$i+1]=='/') { 
  54. $i += 2; 
  55. $_tmp_str = ''
  56. while($str[$i]!=">" && $i<$str_len){ 
  57. $_tmp_str .= $str[$i]; 
  58. $i++; 
  59. $last_data[] = $_tmp_str; 
  60. //查看開始標簽的上一個值 
  61. if(count($pre_data)>0) { 
  62. $last_pre_node = getLastNode($pre_data, 1); 
  63. if($last_pre_node == $_tmp_str) { 
  64. //配對上, 刪除對應位置的值 
  65. array_pop($pre_data); 
  66. array_pop($pre_pos); 
  67. array_pop($last_data); 
  68. else { 
  69. //沒有配對上, 有兩種情況 
  70. //情況一: 只有閉合標簽, 沒有開始標簽 
  71. //情況二:只有開始標簽, 沒有閉合標簽 
  72. array_pop($last_data); 
  73. $error_data[] = $_tmp_str; 
  74. $error_pos[] = $i; 
  75. else { 
  76. array_pop($last_data); 
  77. $error_data[] = $_tmp_str; 
  78. $error_pos[] = $i;  
  79. }else if ($str[$i]=="<" && $str[$i+1]=="!") { 
  80. $i++; 
  81. while($i<$str_len) { 
  82. if($str[$i]=="-" && $str[$i+1]=="-" && $str[$i+2]==">") { 
  83. $i++; 
  84. break
  85. else { 
  86. $i++; 
  87. $i++; 
  88. }else if($str[$i]=='/' && $str[$i+1]=='>') { 
  89. //跳過自動單個閉合標簽 
  90. if($start_flag) { 
  91. array_pop($pre_data); 
  92. array_pop($pre_pos); 
  93. $i+=2; 
  94. }else if($str[$i]=="/" && $str[$i+1]=="*"){ 
  95. $i++; 
  96. while($i<$str_len) { 
  97. if($str[$i]=="*" && $str[$i+1]=="/") { 
  98. $i++; 
  99. break
  100. else { 
  101. $i++; 
  102. $i++; 
  103. }else if($str[$i]=="'"){ 
  104. $i++; 
  105. while($str[$i]!="'" && $i<$str_len) { 
  106. $i++; 
  107. $i++; 
  108. else if($str[$i]=='"'){ 
  109. $i++; 
  110. while($str[$i]!='"' && $i<$str_len ) { 
  111. $i++; 
  112. $i++; 
  113. else { 
  114. $i++; 
  115. //確定起始標簽的位置 
  116. function confirm_pre_pos($str, $pre_pos){ 
  117. $str_len = strlen($str); 
  118. $j=$pre_pos; 
  119. while($j < $str_len) { 
  120. if($str[$j] == '"') { 
  121. $j++; 
  122. while ($j<$str_len) { 
  123. if($str[$j]=='"') { 
  124. $j++; 
  125. break
  126. $j++; 
  127. else if($str[$j] == "'") { 
  128. $j++; 
  129. while ($j<$str_len) { 
  130. if($str[$j]=="'") { 
  131. $j++; 
  132. break
  133. $j++; 
  134. else if($str[$j]==">") { 
  135. $j++; 
  136. while ($j<$str_len) { 
  137. if($str[$j]=="<") { 
  138. //退回到原有內容位置 
  139. $j--; 
  140. break
  141. $j++; 
  142. break
  143. }  
  144. else { 
  145. $j++; 
  146. return $j; 
  147. //確定起始標簽的位置 
  148. function confirm_err_pos($str, $err_pos){ 
  149. $j=$err_pos; 
  150. $j--; 
  151. while($j > 0) { 
  152. if($str[$j] == '"') { 
  153. $j--; 
  154. while ($j<$str_len) { 
  155. if($str[$j]=='"') { 
  156. $j--; 
  157. break
  158. $j--; 
  159. else if($str[$j] == "'") { 
  160. $j--; 
  161. while ($j<$str_len) { 
  162. if($str[$j]=="'") { 
  163. $j--; 
  164. break
  165. $j--; 
  166. else if($str[$j]==">") { 
  167. $j++; 
  168. break
  169. }  
  170. else { 
  171. $j--; 
  172. return $j; 
  173. //獲取數組的倒數第num個值 
  174. function getLastNode(array $arr, $num){ 
  175. $len = count($arr); 
  176. if($len > $num) { 
  177. return $arr[$len-$num]; 
  178. else { 
  179. return $arr[0]; 
  180. //整理數據, 主要是向后看, 進一步進行檢查 
  181. function sort_data(&$pre_data, &$pre_pos, &$error_data, &$error_pos){ 
  182. $rem_key_array = array(); 
  183. $rem_i_array = array(); 
  184. //獲取需要刪除的值 
  185. foreach($error_data as $key=>$value){ 
  186. $count = count($pre_data); 
  187. for($i=($count-1) ; $i>=0; $i--) { 
  188. if($pre_data[$i] == $value && !in_array($i, $rem_i_array)) { 
  189. $rem_key_array[] = $key; 
  190. $rem_i_array[] = $i; 
  191. break
  192. //刪除起始標簽相應的值 
  193. foreach($rem_key_array as $_item) { 
  194. unset($error_pos[$_item]); 
  195. unset($error_data[$_item]); 
  196. //刪除結束標簽相應的值 
  197. foreach($rem_i_array as $_item) { 
  198. unset($pre_data[$_item]); 
  199. unset($pre_pos[$_item]); 
  200. //整理數據, 閉合標簽 
  201. function modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos){ 
  202. $move_log = array(); 
  203. //只有閉合標簽的數據 
  204. foreach ($error_data as $key => $value) { 
  205. // code... 
  206. $_tmp_move_count = 0; 
  207. foreach ($move_log as $pos_key => $move_value) { 
  208. // code... 
  209. if($error_pos[$key]>=$pos_key) { 
  210. $_tmp_move_count += $move_value; 
  211. $data = insert_data($str, $value, $error_pos[$key]+$_tmp_move_count, false); 
  212. $str = $data['str']; 
  213. $move_log[$data['pos']] = $data['move_count']; 
  214. //只有起始標簽的數據 
  215. foreach ($pre_data as $key => $value) { 
  216. // code... 
  217. $_tmp_move_count = 0; 
  218. foreach ($move_log as $pos_key => $move_value) { 
  219. // code... 
  220. if($pre_pos[$key]>=$pos_key) { 
  221. $_tmp_move_count += $move_value; 
  222. $data = insert_data($str, $value, $pre_pos[$key]+$_tmp_move_count, true); 
  223. $str = $data['str']; 
  224. $move_log[$data['pos']] = $data['move_count']; 
  225. return $str; 
  226. //插入數據, $type 表示插入數據的方式 
  227. function insert_data($str, $insert_data, $pos, $type) { 
  228. $len = strlen($str); 
  229. //起始標簽類型 
  230. if($type==true) { 
  231. $move_count = strlen($insert_data)+3; 
  232. $pos = confirm_pre_pos($str, $pos); 
  233. $pre_str = substr($str, 0, $pos); 
  234. $end_str = substr($str, $pos); 
  235. $mid_str = "</" . $insert_data . ">"
  236. //閉合標簽類型 
  237. else { 
  238. $pos = confirm_err_pos($str, $pos); 
  239. $move_count = strlen($insert_data) + 2; 
  240. $pre_str = substr($str, 0, $pos); 
  241. $end_str = substr($str, $pos); 
  242. $mid_str = "<" . $insert_data . ">"
  243. $str = $pre_str.$mid_str.$end_str; 
  244. return array('str'=>$str, 'pos'=>$pos, 'move_count'=>$move_count); 
  245. sort_data($pre_data, $pre_pos, $error_data, $error_pos); 
  246. $new_str = modify_data($str, $pre_data, $pre_pos, $error_data, $error_pos); 
  247. echo $new_str; 
  248. // print_r($pre_data); 
  249. // print_r($pre_pos); 
  250. // print_r($error_data); 
  251. // print_r($error_pos); 
  252. // echo strlen($str); 
  253. // foreach($pre_pos as $value){ 
  254. // $value = confirm_pre_pos($str, $value); 
  255. // for($i=$value-5; $i<=$value; $i++) { 
  256. // echo $str[$i]; 
  257. // } 
  258. // echo "/n"; 
  259. // } 
  260. // foreach($error_pos as $value){ 
  261. // for($i=$value-5; $i<=$value; $i++) { 
  262. // echo $str[$i]; 
  263. // } 
  264. // echo "/n"; 
  265. // } 
  266. ?> 

希望本文所述對大家的php程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西藏| 贵南县| 尼勒克县| 登封市| 浦城县| 新密市| 夏津县| 白河县| 抚州市| 丰原市| 阿拉善右旗| 金塔县| 沽源县| 霍林郭勒市| 鹿邑县| 建始县| 东兰县| 永靖县| 临武县| 喀什市| 那坡县| 赞皇县| 楚雄市| 陇南市| 稷山县| 周口市| 龙门县| 贵南县| 故城县| 铜山县| 太白县| 西安市| 确山县| 曲周县| 禄丰县| 莱州市| 白朗县| 岱山县| 蒲江县| 鄂托克前旗| 广汉市|