W3Cschool
恭喜您成為首批注冊用戶
獲得88經驗值獎勵
Solr 包含一個簡單的命令行工具,即 Post 工具(bin/post 工具),用于將各種類型的內容發(fā)布到 Solr 服務器。
bin/post 工具是一個 Unix shell 腳本;對于 Windows(非 Cygwin)使用情況,請參閱下面的 “Post 工具 windows 支持”一節(jié)。
要運行它,請打開一個窗口并輸入:
bin/post -c gettingstarted example/films/films.json
這將與服務器在 localhost:8983 聯系。指定 collection/core name 是必需的。該 -help(或簡稱 -h)選項將輸出有關其用法的信息(即:bin/post -help)。
在使用 bin/post 時,指定任一 collection/core name 或完整更新 url 是必須的。
bin/post 的基本用法是:
$ bin/post -h
Usage: post -c <collection> [OPTIONS] <files|directories|urls|-d ["...",...]>
or post -help
collection name defaults to DEFAULT_SOLR_COLLECTION if not specified
OPTIONS
=======
Solr options:
-url <base Solr update URL> (overrides collection, host, and port)
-host <host> (default: localhost)
-p or -port <port> (default: 8983)
-commit yes|no (default: yes)
-u or -user <user:pass> (sets BasicAuth credentials)
Web crawl options:
-recursive <depth> (default: 1)
-delay <seconds> (default: 10)
Directory crawl options:
-delay <seconds> (default: 0)
stdin/args options:
-type <content/type> (default: application/xml)
Other options:
-filetypes <type>[,<type>,...] (default: xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log)
-params "<key>=<value>[&<key>=<value>...]" (values must be URL-encoded; these pass through to Solr update request)
-out yes|no (default: no; yes outputs Solr response to console)
...
有幾種方法可以使用 bin/post。本節(jié)介紹幾個例子。
將文件擴展名為 .xml 的所有文檔添加到命名為 gettingstarted 的集合或核心中。
bin/post -c gettingstarted *.xml
將所有帶有文件擴展名為 .xml 的文檔添加到在端口 8984 上運行的 Solr 上的 gettingstarted 集合/內核。
bin/post -c gettingstarted -p 8984 *.xml
發(fā)送 XML 參數以從 gettingstarted 中刪除文檔。
bin/post -c gettingstarted -d '<delete><id>42</id></delete>'
將所有 CSV 文件索引到 gettingstarted:
bin/post -c gettingstarted *.csv
將制表符分隔的文件索引到 gettingstarted:
bin/post -c signals -params "separator=%09" -type text/csv data.tsv
內容類型(-type)參數是需要將文件視為正確的類型,否則將被忽略,并記錄一個警告,因為它不知道 .tsv 文件是什么類型的內容。該 CSV 處理器支持 separator 參數,并通過使用 -params 設置傳遞。
將所有 JSON 文件編入索引 gettingstarted。
bin/post -c gettingstarted *.json
將 PDF 文件索引到 gettingstarted。
bin/post -c gettingstarted a.pdf
自動檢測文件夾中的內容類型,并對其進行遞歸掃描,以便為編入 gettingstarted 的文檔進行索引。
bin/post -c gettingstarted afolder/
自動檢測文件夾中的內容類型,但將其限制為 PPT 和 HTML 文件并將其索引到 gettingstarted。
bin/post -c gettingstarted -filetypes ppt,html afolder/
索引一個 PDF 作為用戶 solr 使用密碼 SolrRocks:
bin/post -u solr:SolrRocks -c gettingstarted a.pdf
bin/post 目前僅作為 Unix shell 腳本存在,但是它將其工作委派給了一個具有跨平臺能力的 Java 程序。該 SimplePostTool 可以直接在支持的環(huán)境,包括 Windows 上運行。
該 bin/post 腳本目前委托給一個名為 SimplePostTool 的獨立 Java 程序。
捆綁到可執(zhí)行 JAR 中的這個工具可以直接運行 java -jar example/exampledocs/post.jar。請參閱 "幫助" 輸出,并從那里獲取文件、遞歸網站或文件系統(tǒng)文件夾,或直接發(fā)送命令到 Solr 服務器。
$ java -jar example/exampledocs/post.jar -h
SimplePostTool version 5.0.0
Usage: java [SystemProperties] -jar post.jar [-h|-] [<file|folder|url|arg> [<file|folder|url|arg>...]]
.
.
.
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯系方式:
更多建議: