Java实现HTML转PDF,零基础入门到精通,收藏这篇就够了
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖
Java实现HTML转PDF
- 效果图
- 一、添加maven依赖
- 二、代码示例
- 三、踩坑:
-
- 1.simsun.ttc 文件找不到问题
- 2.中文显示问题:
- 3. 问题(当然不知这种问题 还有 >等一些特殊转义符号这里只罗列一种)
效果图
上图是 html 效果图
生成PDF效果图如下:
一、添加maven依赖
<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itextpdf</artifactId>
<version>5.5.9</version>
</dependency>
<dependency>
<groupId>com.itextpdf.tool</groupId>
<artifactId>xmlworker</artifactId>
<version>5.5.9</version>
</dependency>
<dependency>
<groupId>com.itextpdf</groupId>
<artifactId>itext-asian</artifactId>
<version>5.2.0</version>
</dependency>
<dependency>
<groupId>org.xhtmlrenderer</groupId>
<artifactId>flying-saucer-pdf-itext5</artifactId>
<version>9.0.3</version>
</dependency>
二、代码示例
java
package com.test;
import com.itextpdf.text.pdf.BaseFont;
import org.xhtmlrenderer.pdf.ITextFontResolver;
import org.xhtmlrenderer.pdf.ITextRenderer;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.OutputStream;
/**
* 文件格式转换工具类
*
* @author lbj
*
* 2015-10-8 上午10:52:22
*/
public class FileTypeConvertUtil {
/**
* 将HTML转成PD格式的文件。html文件的格式比较严格
* @param htmlFile
* @param pdfFile
* @throws Exception
*/
// <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
public static void html2pdf(String htmlFile, String pdfFile) throws Exception {
// step 1
String url = new File(htmlFile).toURI().toURL().toString();
System.out.println(url);
// step 2
OutputStream os = new FileOutputStream(pdfFile);
ITextRenderer renderer = new ITextRenderer();
renderer.setDocument(url);
// step 3 解决中文支持
ITextFontResolver fontResolver = renderer.getFontResolver();
if("linux".equals(getCurrentOperatingSystem())){
fontResolver.addFont("/usr/share/fonts/chiness/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
}else{
fontResolver.addFont("c:/Windows/Fonts/simsun.ttc", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
}
renderer.layout();
renderer.createPDF(os);
os.close();
System.out.println("create pdf done!!");
}
public static String getCurrentOperatingSystem(){
String os = System.getProperty("os.name").toLowerCase();
System.out.println("---------当前操作系统是-----------" + os);
return os;
}
public static void main(String[] args) {
// String htmlFile = "/home/lbj/sign.jsp";
// String pdfFile = "/home/lbj/sign.pdf";
String htmlFile = "d:/table.html";
String pdfFile = "d:/testoone2.pdf";
try {
FileTypeConvertUtil.html2pdf(htmlFile, pdfFile);
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (Exception e) {
e.printStackTrace();
}
}
}
html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8"/>
<title>表格样式</title>
<meta name="viewport" content="initial-scale=1, maximum-scale=1, user-scalable=no, width=device-width"/>
<link rel="stylesheet" href="https://static.loyalvalleycapital.com/web/css/frame.css"/>
<style>
table.table-separate th{
font-weight:bold;
font-size:14px;
border-top:1px solid #F3EDE9 !important;
}
table.table-separate td{
padding: 13px 0;
font-weight:100;
}
.table-separate td.tit{
background-color: #f4f9fe;
font-weight:normal;
padding:22px 0;
width:15%;
}
.table-separate td.cont{
text-align: left;
padding:16px 22px;
width:85%;
line-height:175%;
}
.table-separate.no-border th{
border:none;
text-align: left;
}
.table-separate.no-border td{
text-align: left;
border:none;
}
table {
border-collapse: collapse;
table-layout: fixed;
word-break:break-all;
font-size: 10px;
width: 100%;
text-align: center;
}
td {
word-break:break-all;
word-wrap : break-word;
}
@page {
size:210mm 297mm;//纸张大小A4
margin: 0.25in;
-fs-flow-bottom: "footer";
-fs-flow-left: "left";
-fs-flow-right: "right";
padding: 1em;
}
#footer {
font-size: 90%; font-style: italic;
position: absolute; top: 0; left: 0;
-fs-move-to-flow: "footer";
}
#pagenumber:before {
content: counter(page);
}
#pagecount:before {content: counter(pages);
}
</style>
</head>
<body class="bg-white pb-3" style = "font-family: SimSun;">
<div id="footer" style=""> Page <span id="pagenumber"/> of <span id="pagecount"/> </div>
<div style="max-width:600px;margin:0 auto;padding:10px;">
<div class="f18 text-center mv-2 bold">合伙人服务日报</div>
<div class="f14 text-center mb-3">2017年8月28日</div>
<div class="">
<div class="f14 mb bold">一、旗舰基金股东动态</div>
<div class="f14 mb">1、旗舰基金公司新闻</div>
<table class="table-separate">
<tbody>
<tr>
<td class="tit" valign="middle">刚泰</td>
<td class="cont">
<p class="bold">&nbps;第 3 期员工持股计划(草案)摘要</p>
<p>1、甘肃刚泰控股(集团)股份有限公司(以下简称“公司”)第3期员工持 股计划(以下简称“第3期员工持股计划”)根据《中华人民共和国公司法》、《中华人民共和国证券法》、
《关于上市公司实施员工持股计划试点的指导意见》 及其他有关法律、法规、规范性文件以及《甘肃刚泰控股(集团)股份有限公司章程》的规定制定,遵循公平、公正、公开的原则,旨在完善公司的激励机制,确保公司未来发展战略和经营目标的实现。</p>
<p>4、第3期员工持股计划以“份”作为认购单位,每份份额为1元,起始认购 份数为100万份,超过100万份的,以10万份的整数倍累积计算。公司全部员工 持股计划涉及的股票数量累计不超过公司现有股本总额的10%,任一持有人持有的 员工持股计划份额所对应的标的股票数量不超过公司股本总额的 1%(不包括员工 在公司首次公开发行股票上市前获得的股份、通过二级市场自行购买的股份及通过股权激励获得的股份)。</p>
</td>
</tr>
</tbody>
</table>
<div class="f14 mt-3 mb bold">一、客户沟通和反馈</div>
<div class="f14 mb">今天联系的客户:</div>
<div class="">
<table class="table-separate">
<thead>
<th>联系人</th>
<th>沟通内容</th>
<th>客户反馈</th>
</thead>
<tbody>
<tr>
<td>XXX</td>
<td>XXX</td>
<td>XXX</td>
</tr>
<tr>
<td>XXX</td>
<td>XXX</td>
<td>XXX</td>
</tr>
</tbody>
</table>
</div>
<div class="f14 mt-3 mb bold">三、官网、微信和客户服务系统变化</div>
<div class="">
<table class="table-separate">
<tbody>
<tr>
<td class="tit" valign="middle">运营</td>
<td class="">
<p class="bold">XXX</p>
</td>
<td class="text-left pl-2">
<p>· 上海正心公益基金会正式获批 1727 </p>
<p>· XXXX</p>
</td>
</tr>
</tbody>
</table>
</div>
<div class="f14 mt-3 mb bold">四、其他工作</div>
<div class="f14 mb">近期过生日的客户有: </div>
<div class="">
<p>8.27 王军</p>
<p class="bold">8.27 陈鱼海</p>
</div>
</div>
</div>
</body>
</html>
三、踩坑:
1.simsun.ttc 文件找不到问题
windows 自带有这个文件 。linux下可能会出现字体找不到的问题。解决方法如下:
-
步骤1.在Windows系统中C:\Windows\Fonts目录下找到宋体,复制在桌面后为simsun.ttc


-
登录Linux服务器进行配置。在/usr/share/fonts/目录下创建chinese文件夹并把simsun.ttc放在chinese文件夹里
如下
-
编辑配置文件。在/etc/fonts/目录下找到fonts.conf文件并添加
<dir>/usr/share/fonts/chinese</dir>

- 在/etc/fonts目录下执行刷新命令
//没有该命令则通过 yum search fontconfig 进行安装
fc-cache
- 查看是否安装成功
fc-list :lang=zh

2.中文显示问题:
这里很奇怪为什么引入了 中文字体为什么还是不能显示中文?
这里要注意了:要再你的html 加上一个样式:
style = “font-family: SimSun;”
这样加了之后就会出现中文了。。
3. 问题(当然不知这种问题 还有 >等一些特殊转义符号这里只罗列一种)

当文中出现这种字符的时候 会报错:
因为这个HTML 转PDF 对html代码规范要求非常严格所以这里的头部必须声明:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html lang="en" xmlns="http://www.w3.org/1999/xhtml">
以及其他的都要加</>结束
4.这里出现这样一个问题:
html 中这个换行是OK 的 但是转完PDF之后 是这种情况:
解决办法如下:
添加样式:
table {
border-collapse: collapse;
table-layout: fixed;
word-break:break-all;
font-size: 10px;
width: 100%;
text-align: center;
}
td {
word-break:break-all;
word-wrap : break-word;
}
完美解决了!!
效果图:
另外这里还涉及到分页的情况以及纸张大小设置
@page {
size: 7in 15.25in;
}
这里是设置A4 纸张
body里加入
<div id="footer" style=""> Page <span id="pagenumber"/> of <span id="pagecount"/> </div>
样式上加入
@page {
size:210mm 297mm;//纸张大小A4
margin: 0.25in;
-fs-flow-bottom: "footer";
-fs-flow-left: "left";
-fs-flow-right: "right";
border: thin solid black;
padding: 1em;
}
#footer {
font-size: 90%; font-style: italic;
position: absolute; top: 0; left: 0;
-fs-move-to-flow: "footer";
}
#pagenumber:before {
content: counter(page);
}
#pagecount:before {content: counter(pages);
}
代码:
Java开发的就业市场正在经历结构性调整,竞争日益激烈
传统纯业务开发岗位(如仅完成增删改查业务的后端工程师)的需求,特别是入门级岗位,正显著萎缩。随着企业技术需求升级,市场对Java人才的要求已从通用技能转向了更深入的领域经验(如云原生、微服务)或前沿的AI集成能力。这也导致岗位竞争加剧,在一、二线城市,求职者不仅面临技术内卷,还需应对学历与项目经验的高门槛。
大模型为核心的AI领域正展现出前所未有的就业热度与人才红利
2025年,AI相关新发岗位数量同比激增543%,单月增幅最高超过11倍,大模型算法工程师位居热门岗位前列。行业顶尖人才的供需严重失衡,议价能力极强,跳槽薪资涨幅可达30%-50%。值得注意的是,市场并非单纯青睐算法研究员,而是急需能将大模型能力落地于复杂业务系统的工程人才。这使得具备企业级架构思维和复杂系统整合经验的Java工程师,在向“Java+大模型”复合人才转型时拥有独特优势,成为企业竞相争夺的对象,其薪资天花板也远高于传统Java岗位。

说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。
结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”
先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。
即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!
如何学习AGI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享**
一、2025最新大模型学习路线
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:AI大模型时代的华丽登场
L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。

L2级别:AI大模型RAG应用开发工程
L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3级别:大模型Agent应用架构进阶实践
L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别:大模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
二、大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

三、大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。

四、大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

五、大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
更多推荐

所有评论(0)