Skip to content

Commit 31a9e95

Browse files
author
Ole Liabø
committed
Updated readme.md
1 parent 7585203 commit 31a9e95

File tree

1 file changed

+101
-61
lines changed

1 file changed

+101
-61
lines changed

README.md

Lines changed: 101 additions & 61 deletions
Original file line numberDiff line numberDiff line change
@@ -1,37 +1,41 @@
11

22
# Innhold
33

4-
1. [Introduksjon](#orgb552269)
5-
2. [Systemkrav](#orgb2bff80)
6-
1. [OS-X / Linux](#org5267dec)
7-
3. [Installasjon](#orgbf3ca7e)
8-
4. [Bruk](#orge7c4911)
9-
5. [Sphinx indeksering og søkemotor](#org26f54d9)
10-
6. [Rapporter](#orgbe0665b)
11-
7. [Loggfiler](#org9f51148)
12-
8. [Konfigurasjon](#orge3f57f0)
13-
1. [Tips](#org838a3b3)
14-
9. [Ønsker, feil og mangler](#orgb954aa7)
15-
10. [Hvordan rapportere feil](#org2b5254b)
16-
11. [Historikk](#org407b62e)
17-
1. [01.07.2020 innsyn-v1.1.0](#orga0881a0)
18-
1. [Feilrettinger](#org0845d21)
19-
2. [innsyn-v1.1.0-beta2](#org38bccb2)
20-
1. [Feilrettinger](#org06f5fd1)
21-
3. [innsyn-v1.1.0-beta1](#org2ef42e5)
22-
1. [Nye funksjoner](#org6093bff)
23-
2. [Feilrettinger](#org8f0f3df)
24-
4. [2018.06.01 innsyn-v1.0.0](#orgd0434f1)
25-
5. [2018.04.13 innsyn-v1.0.0-rc1](#org1c3c3e6)
26-
6. [2018.02.05 innsyn-v1.0.0-beta2](#org2ddaace)
27-
7. [2018.01.18 innsyn-v1.0.0-beta1](#org909a1c6)
28-
12. [Utvikling](#orgf8b24b9)
29-
1. [Ubuntu](#orga8ec3eb)
30-
2. [Windows](#orgaa67195)
31-
32-
33-
34-
<a id="orgb552269"></a>
4+
1. [Introduksjon](#orgb08de37)
5+
2. [Systemkrav](#orgd6f4c13)
6+
1. [OS-X / Linux](#orge0e4791)
7+
3. [Installasjon](#org3ba1e3a)
8+
4. [Bruk](#orgca6bb96)
9+
5. [Sphinx indeksering og søkemotor](#orga2ea3e2)
10+
6. [Rapporter](#org580ceb5)
11+
7. [Journaler](#orgeaeeead)
12+
1. [Generering av PDF journaler med OCR](#orgc7f36e1)
13+
8. [Loggfiler](#orgb057092)
14+
9. [Konfigurasjon](#orga6c3ccd)
15+
1. [Tips](#orgda63c78)
16+
10. [Ønsker, feil og mangler](#orga545d20)
17+
11. [Hvordan rapportere feil](#orga005c29)
18+
12. [Historikk](#org5257e0d)
19+
1. [innsyn-v1.2.0-beta1](#org3d2dd28)
20+
1. [Nye funksjoner](#orge2077f0)
21+
2. [01.07.2020 innsyn-v1.1.0](#org32bb6f3)
22+
1. [Feilrettinger](#org753c1dc)
23+
3. [innsyn-v1.1.0-beta2](#org83201e8)
24+
1. [Feilrettinger](#org0f72561)
25+
4. [innsyn-v1.1.0-beta1](#orgb23408e)
26+
1. [Nye funksjoner](#orgf87f345)
27+
2. [Feilrettinger](#orga6e94a1)
28+
5. [2018.06.01 innsyn-v1.0.0](#org61c126b)
29+
6. [2018.04.13 innsyn-v1.0.0-rc1](#org0e41ff0)
30+
7. [2018.02.05 innsyn-v1.0.0-beta2](#org0a19c58)
31+
8. [2018.01.18 innsyn-v1.0.0-beta1](#orgad2d064)
32+
13. [Utvikling](#orgace29a1)
33+
1. [Ubuntu](#orgef4f2df)
34+
2. [Windows](#org094e555)
35+
36+
37+
38+
<a id="orgb08de37"></a>
3539

3640
# Introduksjon
3741

@@ -47,14 +51,14 @@ Innsyn kommer med støtte for disse filformatene:
4751
- TAR: Filformat for som pakker mange filer sammen til en fil og bevarer filinformasjon (filnavn, dato, rettigheter). Innsyn støtter ikke utpakking av enkle tar filer, men viser strukturen.
4852

4953

50-
<a id="orgb2bff80"></a>
54+
<a id="orgd6f4c13"></a>
5155

5256
# Systemkrav
5357

5458
Applikasjonen er testet på Windows 10 64bit.
5559

5660

57-
<a id="org5267dec"></a>
61+
<a id="orge0e4791"></a>
5862

5963
## OS-X / Linux
6064

@@ -71,25 +75,25 @@ Sjekk at det ligger i pathen med:
7175
Copyright (c) 2008-2016, Sphinx Technologies Inc (http://sphinxsearch.com)
7276

7377

74-
<a id="orgbf3ca7e"></a>
78+
<a id="org3ba1e3a"></a>
7579

7680
# Installasjon
7781

78-
1. Pakk ut *innsyn-v1.1.0.zip*.
82+
1. Pakk ut *innsyn-v1.2.0.zip*.
7983
2. Indeksering av vedlegg kan bruke en del plass, rediger derfor eventuelt
8084
*REPORTS\_DIR* i *insight.conf* til å peke på en katalog med mye ledig
8185
diskplass.
8286
3. Språk i brukergrensesnittet kan settes ved å endre *LANGUAGE* i
8387
*insight.conf*. Tilgjenelige språk er *engelsk*, *bokmål* og *nynorsk*. Standard språk er satt til bokmål. Vær obs på at språk ikke bør endres etter at programmet er tatt i bruk.
8488

8589

86-
<a id="orge7c4911"></a>
90+
<a id="orgca6bb96"></a>
8791

8892
# Bruk
8993

9094
![img](./screenshot.png)
9195

92-
1. Kjør *insight.exe* (mac/linux: insight) fra katalogen *innsyn-v1.1.0*.
96+
1. Kjør *insight.exe* (mac/linux: insight) fra katalogen *innsyn-v1.2.0*.
9397
2. Brukergrensesnittet har fire hovedelementer:
9498
1. **Nodetre**: Viser alle elementene i uttrekket i en trestrukture etter en import.
9599
Hver node i treet tilsvarer en XML knagg. Nodetreet viser også tidligere
@@ -127,7 +131,7 @@ Sjekk at det ligger i pathen med:
127131
e-post. Vær klar over at skjermet informasjon ikke skal sendes på vanlig e-post.
128132

129133

130-
<a id="org26f54d9"></a>
134+
<a id="orga2ea3e2"></a>
131135

132136
# Sphinx indeksering og søkemotor
133137

@@ -149,7 +153,7 @@ Når Innsyn kjører og man har lastet og indeksert ett uttrekk, kan man kjøre S
149153
Se Sphinx manualen for mer informasjon.
150154

151155

152-
<a id="orgbe0665b"></a>
156+
<a id="org580ceb5"></a>
153157

154158
# Rapporter
155159

@@ -159,25 +163,48 @@ formatet: *REPORTS\_DIR\\åååå\MM\DD\TTMMSS\\*. I rapport katalogen
159163
legges også loggfiler fra indekseringen og indekserings databasen.
160164

161165

162-
<a id="org9f51148"></a>
166+
<a id="orgeaeeead"></a>
167+
168+
# Journaler
169+
170+
![img](./journal.png)
171+
172+
For noen XML strukturer kan det være en 1 til mange relasjon mellom en node i XMLen og filer i arkivpakken. Et eksempel på dette er Norsk Helsearkiv arkivpakker der avlxml filen kan referere til flere digitaliserte sider og tilhørende OCR metadata.
173+
Denne sammenhengen kan defineres i format filen med nøkkelen *INFO\_VIEW\_JOURNAL\_TYPE\_REGEXP*. Noder som treffer denne nøkkelen vi få en **Journal** knapp nederst i nodeinformasjon visningen.
174+
Journal visningsmoduset lar brukerene velge ut enkeltsider i journalen som skal eksporteres.
175+
176+
177+
<a id="orgc7f36e1"></a>
178+
179+
## Generering av PDF journaler med OCR
180+
181+
Journaler støtter visning og eksport av journaler som en *søkbar-PDF*, der hver side består av det digitaliserte bildet (feks en JPG) og den gjenskapte teksten (OCR) som et usynlig lag.
182+
Støttet OCR format er ALTO og HOCR. For mer informasjon se scriptet *pdf\create-pdf.cmd*. For å generere PDFer kreves det at flere verktøy er installert og tilgjengelig i søkestien:
183+
184+
- python: For kjøring av [HocrConverter.py](https://github.com/piql/HocrConverter) som genererer søkbare PDFer.
185+
- [pdftk](http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/): Slår sammen flere enkeltstående PDF sider til en PDF.
186+
- [alto\_\_hocr.xsl](https://github.com/filak/hOCR-to-ALTO): XSLT skjema for ALTO til hOCR konvertering
187+
188+
189+
<a id="orgb057092"></a>
163190

164191
# Loggfiler
165192

166-
- **innsyn-v1.1.0\insight.log**: Applikasjonslogg.
167-
- **innsyn-v1.1.0\insight.dmp**: Genereres hvis applikasjonen krasjer.
193+
- **innsyn-v1.2.0\insight.log**: Applikasjonslogg.
194+
- **innsyn-v1.2.0\insight.dmp**: Genereres hvis applikasjonen krasjer.
168195
- **REPORTS\_DIR\YYYY\MM\DD\TTMMSS\attachments.log**: Logg over konvertering av vedlegg til søkbare tekstfiler.
169196
- **REPORTS\_DIR\YYYY\MM\DD\TTMMSS\indexer.log**: Logg fra indekserings applikasjonen som genererer indekserings databasen.
170197
- **REPORTS\_DIR\YYYY\MM\DD\TTMMSS\sphinx\test1\searchd.log**: Logg fra søkemotoren.
171198

172199

173-
<a id="orge3f57f0"></a>
200+
<a id="orga6c3ccd"></a>
174201

175202
# Konfigurasjon
176203

177204
Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på hva som kan konfigureres. Ved endring må applikasjonen restartes. Hvert enkelt filformat har sin egen konfigurasjonsfil. De ligger i mappen *formats*. Alle filene som slutter på *.conf* i denne katalogen vil ved oppstart leses inn og vises som ett eget import format i applikasjonen.
178205

179206

180-
<a id="org838a3b3"></a>
207+
<a id="orgda63c78"></a>
181208

182209
## Tips
183210

@@ -186,7 +213,7 @@ Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på
186213
Prøv med `insight -platform windows:dpiawareness=0` for å få riktig størrelse på vinduet. Beskrivelse av andre parametere som tweaker utseendet finnes her: <https://doc.qt.io/qt-5/qguiapplication.html#supported-command-line-options>
187214

188215

189-
<a id="orgb954aa7"></a>
216+
<a id="orga545d20"></a>
190217

191218
# Ønsker, feil og mangler
192219

@@ -217,50 +244,63 @@ Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på
217244
på disken.
218245

219246

220-
<a id="org2b5254b"></a>
247+
<a id="orga005c29"></a>
221248

222249
# Hvordan rapportere feil
223250

224251
ole.liabo@piql.com
225252
Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis den finnes.
226253

227254

228-
<a id="org407b62e"></a>
255+
<a id="org5257e0d"></a>
229256

230257
# Historikk
231258

232259

233-
<a id="orga0881a0"></a>
260+
<a id="org3d2dd28"></a>
261+
262+
## innsyn-v1.2.0-beta1
263+
264+
265+
<a id="orge2077f0"></a>
266+
267+
### Nye funksjoner
268+
269+
- Støtte for standard ut mappe ved eksport, settes med konfigurasjonsvariablen *FIXED\_REPORT\_EXPORT\_FOLDER*.
270+
- Søtte for journaler
271+
272+
273+
<a id="org32bb6f3"></a>
234274

235275
## 01.07.2020 innsyn-v1.1.0
236276

237277

238-
<a id="org0845d21"></a>
278+
<a id="org753c1dc"></a>
239279

240280
### Feilrettinger
241281

242282
- Opptegning av info nodeinformasjon: Vise all tekst for noder, og likt mellomrom mellom alle noder.
243283
- Lese inn konfig filer som UTF-8 på Windows.
244284

245285

246-
<a id="org38bccb2"></a>
286+
<a id="org83201e8"></a>
247287

248288
## innsyn-v1.1.0-beta2
249289

250290

251-
<a id="org06f5fd1"></a>
291+
<a id="org0f72561"></a>
252292

253293
### Feilrettinger
254294

255295
- Installasjon for Windows.
256296

257297

258-
<a id="org2ef42e5"></a>
298+
<a id="orgb23408e"></a>
259299

260300
## innsyn-v1.1.0-beta1
261301

262302

263-
<a id="org6093bff"></a>
303+
<a id="orgf87f345"></a>
264304

265305
### Nye funksjoner
266306

@@ -271,22 +311,22 @@ Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis d
271311
- Støtte for å endre XML-løv noder basert på både node navnet og innholdet i noden.
272312

273313

274-
<a id="org8f0f3df"></a>
314+
<a id="orga6e94a1"></a>
275315

276316
### Feilrettinger
277317

278318
- Oppsett av Sphinx indexer og søkemotor på Linux / OS-X.
279319
- Melding etter konvertering av vedlegg. Får beskjed både om at konvertering feilet og at vedlegg er tomme.
280320

281321

282-
<a id="orgd0434f1"></a>
322+
<a id="org61c126b"></a>
283323

284324
## 2018.06.01 innsyn-v1.0.0
285325

286326
- [IKAMR-20180425-02] BUG på norske tegn i søk? Hvis her er norske tegn så virker ikke "Skill mellom små og store bokstaver" som IKKE avkrysset dvs. <fornavn>TORBJØRN</fornavn> vil ikke få treff når jeg søker med "Torbjørn".
287327

288328

289-
<a id="org1c3c3e6"></a>
329+
<a id="org0e41ff0"></a>
290330

291331
## 2018.04.13 innsyn-v1.0.0-rc1
292332

@@ -309,7 +349,7 @@ Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis d
309349
- [IKARO-20180223-01] Jeg har en rekke tidligere kjøringer listet i hovedvinduet når jeg starter opp. Disse er tomme. Hvis jeg prøver å «Åpne» en av disse, så krasjer Insight. Det blir ikke lagt en insight.dmp. Dette skjer hver gang.
310350

311351

312-
<a id="org2ddaace"></a>
352+
<a id="org0a19c58"></a>
313353

314354
## 2018.02.05 innsyn-v1.0.0-beta2
315355

@@ -331,14 +371,14 @@ Oppdateringer basert på tilbakemeldinger fra IKA-MR, IKA-VA og IKA-Rogaland.
331371
- [PIQL-20180122-03] Viser størrelsen på vedlegg ved import.
332372

333373

334-
<a id="org909a1c6"></a>
374+
<a id="orgad2d064"></a>
335375

336376
## 2018.01.18 innsyn-v1.0.0-beta1
337377

338378
Første versjon levert til beta test.
339379

340380

341-
<a id="orgf8b24b9"></a>
381+
<a id="orgace29a1"></a>
342382

343383
# Utvikling
344384

@@ -356,7 +396,7 @@ create-release-osx.sh
356396
create-release.cmd
357397

358398

359-
<a id="orga8ec3eb"></a>
399+
<a id="orgef4f2df"></a>
360400

361401
## Ubuntu
362402

@@ -366,7 +406,7 @@ sudo apt install libquazip5-dev
366406
sudo apt install qttools5-dev-tools
367407

368408

369-
<a id="orgaa67195"></a>
409+
<a id="org094e555"></a>
370410

371411
## Windows
372412

0 commit comments

Comments
 (0)