我是编程乐趣,一个10年.Net开发经验老程序员,点击右上方“关注”,每天为你分享开源项目和编程知识。
推荐一个开源库,轻松实现HTML转化为OpenXml。
01
项目简介
Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。
该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的
随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。
02
项目核心功能
HTML转OpenXml:该库能够将HTML文档(包括简单的文本、图像、表格等)转换为OpenXml格式的组件,进而可以被Microsoft Word等应用程序识别和处理。
.Net支持版本:Html2OpenXml 支持.Net Framework 4.6.2、.NET Standard 2.0 和 .NET 8,确保了在不同.Net环境下的兼容性。
依赖:该库依赖于DocumentFormat.OpenXml和AngleSharp这两个包,分别用于处理OpenXml文档和HTML解析。
03
支持Html标签
常规标签:如<a>, <h1>-<h6>, <b>, <i>, <u>, <s>, <del>, <ins>, <em>, <strike>, <strong>等。
图像和图表:<img>, <figcaption>, <svg>。
表格相关:<table>, <td>, <tr>, <th>, <tbody>, <thead>, <tfoot>, <caption>, <col>。
其他常用标签:如<div>, <span>, <p>, <ul>, <ol>, <li>, <q>, <blockquote>, <article>, <aside>, <section>等。
需要注意的是,标签的样式属性style是支持的,但JavaScript (<script>), CSS样式(<style>), <meta>标签、注释、按钮和输入控件等HTML元素在转换过程中会被忽略。
04
使用示例
该项目有着详细的开发文档,并且项目中也提供示例。
开发文档:
https://github.com/onizet/html2openxml/wiki
Html转为Word示例截图
Html代码
转换后的Word截图
从截图可以看出Html标签、样式等都可以正常转换过来。
05
项目地址
https://github.com/onizet/html2openxml
- End -
.Net开源项目合集:https://github.com/bianchenglequ/NetCodeTop
推荐阅读