Solr:Post工具

2018-11-17 11:26 更新

Solr 包含一個簡單的命令行工具,即 Post 工具(bin/post 工具),用于將各種類型的內容發(fā)布到 Solr 服務器。

bin/post 工具是一個 Unix shell 腳本;對于 Windows(非 Cygwin)使用情況,請參閱下面的 “Post 工具 windows 支持”一節(jié)。

要運行它,請打開一個窗口并輸入:

bin/post -c gettingstarted example/films/films.json

這將與服務器在 localhost:8983 聯系。指定 collection/core name 是必需的。該 -help(或簡稱 -h)選項將輸出有關其用法的信息(即:bin/post -help)。

使用 bin / post 工具

在使用 bin/post 時,指定任一 collection/core name 或完整更新 url 是必須的。

bin/post 的基本用法是:

$ bin/post -h
Usage: post -c <collection> [OPTIONS] <files|directories|urls|-d ["...",...]>
    or post -help

   collection name defaults to DEFAULT_SOLR_COLLECTION if not specified

OPTIONS
=======
  Solr options:
    -url <base Solr update URL> (overrides collection, host, and port)
    -host <host> (default: localhost)
    -p or -port <port> (default: 8983)
    -commit yes|no (default: yes)
    -u or -user <user:pass> (sets BasicAuth credentials)

  Web crawl options:
    -recursive <depth> (default: 1)
    -delay <seconds> (default: 10)


  Directory crawl options:
    -delay <seconds> (default: 0)

  stdin/args options:
    -type <content/type> (default: application/xml)


  Other options:
    -filetypes <type>[,<type>,...] (default: xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log)
    -params "<key>=<value>[&<key>=<value>...]" (values must be URL-encoded; these pass through to Solr update request)
    -out yes|no (default: no; yes outputs Solr response to console)
...

使用 bin / post 示例

有幾種方法可以使用 bin/post。本節(jié)介紹幾個例子。

索引 XML

將文件擴展名為 .xml 的所有文檔添加到命名為 gettingstarted 的集合或核心中。

bin/post -c gettingstarted *.xml

將所有帶有文件擴展名為 .xml 的文檔添加到在端口 8984 上運行的 Solr 上的 gettingstarted 集合/內核。

bin/post -c gettingstarted -p 8984 *.xml

發(fā)送 XML 參數以從 gettingstarted 中刪除文檔。

bin/post -c gettingstarted -d '<delete><id>42</id></delete>'

索引 CSV

將所有 CSV 文件索引到 gettingstarted:

bin/post -c gettingstarted *.csv

將制表符分隔的文件索引到 gettingstarted:

bin/post -c signals -params "separator=%09" -type text/csv data.tsv

內容類型(-type)參數是需要將文件視為正確的類型,否則將被忽略,并記錄一個警告,因為它不知道 .tsv 文件是什么類型的內容。該 CSV 處理器支持 separator 參數,并通過使用 -params 設置傳遞。

索引 JSON

將所有 JSON 文件編入索引 gettingstarted。

bin/post -c gettingstarted *.json

索引豐富的文檔(PDF、Word、HTML等)

將 PDF 文件索引到 gettingstarted。

bin/post -c gettingstarted a.pdf

自動檢測文件夾中的內容類型,并對其進行遞歸掃描,以便為編入 gettingstarted 的文檔進行索引。

bin/post -c gettingstarted afolder/

自動檢測文件夾中的內容類型,但將其限制為 PPT 和 HTML 文件并將其索引到 gettingstarted。

bin/post -c gettingstarted -filetypes ppt,html afolder/

索引到受密碼保護的 Solr(基本身份驗證)

索引一個 PDF 作為用戶 solr 使用密碼 SolrRocks:

bin/post -u solr:SolrRocks -c gettingstarted a.pdf

發(fā)布工具 Windows 支持

bin/post 目前僅作為 Unix shell 腳本存在,但是它將其工作委派給了一個具有跨平臺能力的 Java 程序。該 SimplePostTool 可以直接在支持的環(huán)境,包括 Windows 上運行。

SimplePostTool

該 bin/post 腳本目前委托給一個名為 SimplePostTool 的獨立 Java 程序。

捆綁到可執(zhí)行 JAR 中的這個工具可以直接運行 java -jar example/exampledocs/post.jar。請參閱 "幫助" 輸出,并從那里獲取文件、遞歸網站或文件系統(tǒng)文件夾,或直接發(fā)送命令到 Solr 服務器。

$ java -jar example/exampledocs/post.jar -h
SimplePostTool version 5.0.0
Usage: java [SystemProperties] -jar post.jar [-h|-] [<file|folder|url|arg> [<file|folder|url|arg>...]]
.
.
.
以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號