peaeater

## gist:5810540
<!-- request handler to return typeahead suggestions -->
<requestHandler name="/suggest" class="solr.SearchHandler">
  <lst name="defaults">
    <str name="echoParams">explicit</str>
    <str name="defType">edismax</str>
    <str name="rows">10</str>
    <str name="fl">universe,collection,title,score</str>
    <str name="qf">title_suggest^30 title_suggest_ngram^50.0 collection_suggest^15 collection_suggest_ngram^25.0</str>
    <str name="pf">title_suggest_edge^50.0 collection_suggest_edge^25.0</str>
    <str name="group">true</str>

## gist:5810550
   <!-- suggest fields -->
   <copyField source="title" dest="title_suggest" />
   <copyField source="title" dest="title_suggest_edge" />
   <copyField source="title" dest="title_suggest_ngram" />
   <copyField source="title" dest="title_s" />
   <copyField source="collection" dest="collection_suggest" />
   <copyField source="collection" dest="collection_suggest_edge" />
   <copyField source="collection" dest="collection_suggest_ngram" />
   <copyField source="collection" dest="collection_s" />
   <copyField source="universe" dest="universe_suggest" />

## gist:5810559
    <!-- text_suggest : Matches whole terms in the suggest text  -->
    <fieldType name="text_suggest" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory"
              generateWordParts="1"
              generateNumberParts="1"
              catenateWords="1"
              catenateNumbers="1"

## powershell filename replace
ls * -name | ren -newname {$_ -replace '^(.*)-replaceme-(.*)$', '$1-newvalue-$2'}

## text_suggest_ngram.xml
    <fieldType name="text_suggest_ngram" class="solr.TextField">
      <analyzer type="index">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" maxGramSize="20" minGramSize="1"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="([^\w\d\*æøåÆØÅ ])" replacement="" replace="all"/>
      </analyzer>
      <analyzer type="query">

## text_suggest_edge.xml
    <fieldType name="text_suggest_edge" class="solr.TextField">
      <analyzer type="index">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <tokenizer class="solr.KeywordTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="([\.,;:-_])" replacement=" " replace="all"/>
        <filter class="solr.EdgeNGramFilterFactory" maxGramSize="30" minGramSize="1"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="([^\w\d\*æøåÆØÅ ])" replacement="" replace="all"/>
      </analyzer>
      <analyzer type="query">

## pdf2djvu.ps1
# convert pdf to djvu
# accepts a .pdf input, outputs a 300dpi .djvu, returns djvu full name
# requires pdf2djvu

param(
    [Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
    [ValidateScript({[System.IO.Path]::GetExtension($_) -eq ".pdf"})]
	[string]$in,
    [Parameter(Mandatory=$false,ValueFromPipeline=$true,Position=1)]
    [ValidateScript({[System.IO.Path]::GetExtension($_) -eq ".djvu"})]

## djvu2txt.ps1
# extract plain text per page from djvu
# requires djvulibre

param(
    [Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
    [string]$in
)

process
{

## djvu2xml.ps1
# extract hidden text xml per page from djvu
# requires djvulibre

param(
    [Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
    [string]$in
)

process
{

## djvu2tif.ps1
# extract tif per page from djvu
# requires djvulibre

param(
    [Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
    [string]$in
)

process
{
	<!-- request handler to return typeahead suggestions -->
	<requestHandler name="/suggest" class="solr.SearchHandler">
	<lst name="defaults">
	<str name="echoParams">explicit</str>
	<str name="defType">edismax</str>
	<str name="rows">10</str>
	<str name="fl">universe,collection,title,score</str>
	<str name="qf">title_suggest^30 title_suggest_ngram^50.0 collection_suggest^15 collection_suggest_ngram^25.0</str>
	<str name="pf">title_suggest_edge^50.0 collection_suggest_edge^25.0</str>
	<str name="group">true</str>
	<!-- suggest fields -->
	<copyField source="title" dest="title_suggest" />
	<copyField source="title" dest="title_suggest_edge" />
	<copyField source="title" dest="title_suggest_ngram" />
	<copyField source="title" dest="title_s" />
	<copyField source="collection" dest="collection_suggest" />
	<copyField source="collection" dest="collection_suggest_edge" />
	<copyField source="collection" dest="collection_suggest_ngram" />
	<copyField source="collection" dest="collection_s" />
	<copyField source="universe" dest="universe_suggest" />
	<!-- text_suggest : Matches whole terms in the suggest text -->
	<fieldType name="text_suggest" class="solr.TextField" positionIncrementGap="100">
	<analyzer type="index">
	<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
	<tokenizer class="solr.StandardTokenizerFactory"/>
	<filter class="solr.WordDelimiterFilterFactory"
	generateWordParts="1"
	generateNumberParts="1"
	catenateWords="1"
	catenateNumbers="1"
	<fieldType name="text_suggest_ngram" class="solr.TextField">
	<analyzer type="index">
	<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
	<tokenizer class="solr.StandardTokenizerFactory"/>
	<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
	<filter class="solr.LowerCaseFilterFactory"/>
	<filter class="solr.EdgeNGramFilterFactory" maxGramSize="20" minGramSize="1"/>
	<filter class="solr.PatternReplaceFilterFactory" pattern="([^\w\d\*æøåÆØÅ ])" replacement="" replace="all"/>
	</analyzer>
	<analyzer type="query">
	<fieldType name="text_suggest_edge" class="solr.TextField">
	<analyzer type="index">
	<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
	<tokenizer class="solr.KeywordTokenizerFactory"/>
	<filter class="solr.LowerCaseFilterFactory"/>
	<filter class="solr.PatternReplaceFilterFactory" pattern="([\.,;:-_])" replacement=" " replace="all"/>
	<filter class="solr.EdgeNGramFilterFactory" maxGramSize="30" minGramSize="1"/>
	<filter class="solr.PatternReplaceFilterFactory" pattern="([^\w\d\*æøåÆØÅ ])" replacement="" replace="all"/>
	</analyzer>
	<analyzer type="query">
	# convert pdf to djvu
	# accepts a .pdf input, outputs a 300dpi .djvu, returns djvu full name
	# requires pdf2djvu

	param(
	[Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
	[ValidateScript({[System.IO.Path]::GetExtension($_) -eq ".pdf"})]
	[string]$in,
	[Parameter(Mandatory=$false,ValueFromPipeline=$true,Position=1)]
	[ValidateScript({[System.IO.Path]::GetExtension($_) -eq ".djvu"})]
	# extract plain text per page from djvu
	# requires djvulibre

	param(
	[Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
	[string]$in
	)

	process
	{
	# extract hidden text xml per page from djvu
	# requires djvulibre

	param(
	[Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
	[string]$in
	)

	process
	{
	# extract tif per page from djvu
	# requires djvulibre

	param(
	[Parameter(Mandatory=$true,ValueFromPipeline=$true,Position=0)]
	[string]$in
	)

	process
	{