Nedlastingsverktøy for brettboka.no
Laster ned hver side som et bilde
Boken må være kjøpt
- logg inn på web-versjonen av brettboka.no, og åpne boken du vil laste ned
- trykk f12 for å åpne konsollen
- gå til den første siden i boka (side 1)
- Velg at bare 1 side skal vises om gangen, eller reduser størrelsen på nettleservinduet slik at bare éi side vises om gangen.
- kopier koden fra brettboka-dl.js til konsollen og trykk enter
- den vil nå bla gjennom alle sidene og laste ned hver side som et bilde
- når den er ferdig er det bare å lukke fanen
- alle bildene er i nedlastingsmappen
- gå til mappen hvor du har lastet ned bildene (nedlastinger)
- sjekk at alle bildene er der
- velg alle bildene
- høyreklikk DET FØRSTE bildet
- velg "print"
- gå gjennom menyen, og velg
- printer: "Microsoft Print to PDF"
- paper size: "letter"
- options ->
- sharpen for printing off
- only show options that are compatible with my printer off
- printer properties ->
- orientation: "portrait"
- ok
- trykk print
Den laster bare ned annenhver side!
- Se steg 4: Reduser størrelsen på nettleservinduet slik at bare éi side vises om gangen
Den hopper over noen sider!
- Helt nederst i koden står det "1500". Det vil si at den venter 1.5 sekunder hver gang den går til neste side. Prøv å øk dette tallet til f.eks 3000. Da vil den gå en del tregere, men det kan være mere treffsikkert hvis man har tregt internett eller en treg PC.
Jeg kan ikke søke på teksten som står i PDF-en!
- Søk på google etter "PDF OCR", last opp PDF-en til en av disse sidene og last den ned igjen som en søkbar PDF. Disse tjenestene scanner bildene i PDF-en og legger til teksten. Da kan man åpne fila i f.eks Edge, Chrome eller Adobe Reader og trykke
ctrl
+f
for å søke på tekst. Da kan man også selecte teksten og kopiere den. - Hvis du har pro versjon av Adobe Acrobat, så fungerer OCR-modulen her bedre enn på de fleste andre internett-versjonene. OBS: Scanningen funker i noen tilfeller dårlig, og det er feil tekst som kommer ut, og noen ganger vil man ikke finne ting når man søker på de.
Nedlastingen står som forbereder nedlasting for evig!
- Hvis du bruker Mac, så feiler noen ganger Safari med å laste ned sider og den vil være stuck, og da kan det fungere bedre å bruke Chrome enn Safari.
Et par tips & tricks:
Har du Mac så vil safari noen ganger ikke laste ned en side; den vil stå som forbereder nedlasting for evig, bruk en annen nettleser, CHROME funker fett. Merket også at jeg måtte øke fra 1500 ms til f.eks 2500 eller 3000 for at den ikke hoppet over noen sider.
Bedre kvalitet på tekst og OCR med Adobe Acrobat:
Har du Adobe Acrobat kan du åpne PDFen I Acrobat og velg edit PDF som ligger under Verktøy (Tools), dette vil automatisk konvertere bildene til OCR. (OBS pass på at du velger NORSK som språk for mer presisjon). Deretter er det bare å velge fil -> lagre som, for å lagre den nye PDFen hvor tekst kan markeres og er søkbar.
OCR på nett funker til en viss grad, men med de jeg prøvde så ble ordene jeg søkte på matcha med usynlig tekst plassert et annet sted enn der teksten er. I mange tilfeller ble mange ord lagt oppå hverandre og det er kronglete å finne ut av hvor ordet egentlig er. Adobe Acrobat sin konvertering til OCR funka fett.
EDIT: verdt å merke at du kan nå velge om det skal vises 1 eller 2 sider omgangen på brettboka, gjør jobben en god del enklere.