下面演示如何从二进制文件,如:mp3中提取文件的相关信息,如标题、作者等
首先还是展示一下我们的schema.xml文加
然后在solrconfig.xml文件添加以下配置:
true ignored_ true
说明:
<str name="lowernames">true</str> :将从二进制文件中抽取的元数据信息字段名都转换为小写
<str name="uprefix">ignored_</str>:如果从二进制文件中抽取出来的字段名在schema.xml中没有定义时,使用的字段名前缀
<str name="captureAttr">true</str>:捕获二进制文件的一些属性信息
重启solr服务
curl "http://localhost:8983/solr/update/extract?literal.id=1&commit=true" -F "myfile=@sample.mp3"