tika-app-1.6.jar包是一款可以轻松提取文本正文的工具,它集成了POI, Pdfbox,并且为文本抽取工作提供了一个统一的界面,提供了便利的扩展API,用来丰富其对第三方文件格式的支持,需要的朋友欢迎前来下载使用!

tika-app-1.6.jar包简介:

Tika是一个用于文本解释的框架,其本身并不提供任何的库用于解释文本,而是调用各种各样的库,如POI,PDFBox等。使用Tika,可以提取文件中的作者、标题、创建时间、正文等内容,相比于Java.io自带的一些功能。

tika-app-1.6.jar包使用方法:

1.进入Tika所有的目录,运行以下命令:java -jar "tika-app-1.5 (1).jar" -g

2.Tika的图形界面被打开,然后找开File-openURL:

3.点击确认后,即返回解释结果。默认情况下显示的是文本的元信息

4.可以通过view菜单中的选项,分别查看 metadata, formatted text, plain text, main content, stuctured text等信息。

1. 本站所有文章及资源来源于用户上传和网络,如有侵权请联系站长处理!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律,否则后果自负!
4. 如有链接无法下载、失效或广告,请联系管理员处理!
5. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!

中国站长社区 » tika-app-1.6.jar包 官方免费版

发表评论