博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
(六) 从二进制文件提取数据元信息,并导入到solr
阅读量:5979 次
发布时间:2019-06-20

本文共 593 字,大约阅读时间需要 1 分钟。

下面演示如何从二进制文件,如:mp3中提取文件的相关信息,如标题、作者等

首先还是展示一下我们的schema.xml文加

然后在solrconfig.xml文件添加以下配置:

true
ignored_
true

说明:

<str name="lowernames">true</str> :将从二进制文件中抽取的元数据信息字段名都转换为小写

<str name="uprefix">ignored_</str>:如果从二进制文件中抽取出来的字段名在schema.xml中没有定义时,使用的字段名前缀

<str name="captureAttr">true</str>:捕获二进制文件的一些属性信息

 

重启solr服务

curl "http://localhost:8983/solr/update/extract?literal.id=1&commit=true" -F "myfile=@sample.mp3"

转载于:https://www.cnblogs.com/xiazh/archive/2012/10/29/2545325.html

你可能感兴趣的文章
为社会做点回馈吧
查看>>
消除各类乱码的方法
查看>>
搜索框(SearchView)的功能与用法
查看>>
js有别于java的一些语法(了解)
查看>>
重新学习ubuntu -- 学习UEFI 引导安装系统
查看>>
spring AOP
查看>>
MySQL中SYSDATE()和NOW()的区别
查看>>
飞康CDP训练营 免费学习
查看>>
CSS派生选择器
查看>>
四舍五入保留两位小数--Java
查看>>
jdbc@1521:orcl和jdbc@1521/orcl的区别
查看>>
lnmp一键安装之后的后续配置(如mysql文件的存放位置,更改网站默认目录等...)...
查看>>
java中成员变量和局部变量的区别
查看>>
$('')[0]
查看>>
马哥2016全新Linux+Python高端运维班-Linux grep正则表达式练习,及find命令
查看>>
windows 杀服务
查看>>
去掉a标签的感应虚线
查看>>
Mac 设置java_home
查看>>
Spring的JdbcTemplate类中的RowCallbackHandler类
查看>>
增加和删除用户组
查看>>