You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
1.[Generering av PDF journaler med OCR](#orgc7f36e1)
13
+
8.[Loggfiler](#orgb057092)
14
+
9.[Konfigurasjon](#orga6c3ccd)
15
+
1.[Tips](#orgda63c78)
16
+
10.[Ønsker, feil og mangler](#orga545d20)
17
+
11.[Hvordan rapportere feil](#orga005c29)
18
+
12.[Historikk](#org5257e0d)
19
+
1.[innsyn-v1.2.0-beta1](#org3d2dd28)
20
+
1.[Nye funksjoner](#orge2077f0)
21
+
2.[01.07.2020 innsyn-v1.1.0](#org32bb6f3)
22
+
1.[Feilrettinger](#org753c1dc)
23
+
3.[innsyn-v1.1.0-beta2](#org83201e8)
24
+
1.[Feilrettinger](#org0f72561)
25
+
4.[innsyn-v1.1.0-beta1](#orgb23408e)
26
+
1.[Nye funksjoner](#orgf87f345)
27
+
2.[Feilrettinger](#orga6e94a1)
28
+
5.[2018.06.01 innsyn-v1.0.0](#org61c126b)
29
+
6.[2018.04.13 innsyn-v1.0.0-rc1](#org0e41ff0)
30
+
7.[2018.02.05 innsyn-v1.0.0-beta2](#org0a19c58)
31
+
8.[2018.01.18 innsyn-v1.0.0-beta1](#orgad2d064)
32
+
13.[Utvikling](#orgace29a1)
33
+
1.[Ubuntu](#orgef4f2df)
34
+
2.[Windows](#org094e555)
35
+
36
+
37
+
38
+
<aid="orgb08de37"></a>
35
39
36
40
# Introduksjon
37
41
@@ -47,14 +51,14 @@ Innsyn kommer med støtte for disse filformatene:
47
51
- TAR: Filformat for som pakker mange filer sammen til en fil og bevarer filinformasjon (filnavn, dato, rettigheter). Innsyn støtter ikke utpakking av enkle tar filer, men viser strukturen.
48
52
49
53
50
-
<aid="orgb2bff80"></a>
54
+
<aid="orgd6f4c13"></a>
51
55
52
56
# Systemkrav
53
57
54
58
Applikasjonen er testet på Windows 10 64bit.
55
59
56
60
57
-
<aid="org5267dec"></a>
61
+
<aid="orge0e4791"></a>
58
62
59
63
## OS-X / Linux
60
64
@@ -71,25 +75,25 @@ Sjekk at det ligger i pathen med:
2. Indeksering av vedlegg kan bruke en del plass, rediger derfor eventuelt
80
84
*REPORTS\_DIR* i *insight.conf* til å peke på en katalog med mye ledig
81
85
diskplass.
82
86
3. Språk i brukergrensesnittet kan settes ved å endre *LANGUAGE* i
83
87
*insight.conf*. Tilgjenelige språk er *engelsk*, *bokmål* og *nynorsk*. Standard språk er satt til bokmål. Vær obs på at språk ikke bør endres etter at programmet er tatt i bruk.
84
88
85
89
86
-
<aid="orge7c4911"></a>
90
+
<aid="orgca6bb96"></a>
87
91
88
92
# Bruk
89
93
90
94

91
95
92
-
1. Kjør *insight.exe* (mac/linux: insight) fra katalogen *innsyn-v1.1.0*.
96
+
1. Kjør *insight.exe* (mac/linux: insight) fra katalogen *innsyn-v1.2.0*.
93
97
2. Brukergrensesnittet har fire hovedelementer:
94
98
1.**Nodetre**: Viser alle elementene i uttrekket i en trestrukture etter en import.
95
99
Hver node i treet tilsvarer en XML knagg. Nodetreet viser også tidligere
@@ -127,7 +131,7 @@ Sjekk at det ligger i pathen med:
127
131
e-post. Vær klar over at skjermet informasjon ikke skal sendes på vanlig e-post.
128
132
129
133
130
-
<aid="org26f54d9"></a>
134
+
<aid="orga2ea3e2"></a>
131
135
132
136
# Sphinx indeksering og søkemotor
133
137
@@ -149,7 +153,7 @@ Når Innsyn kjører og man har lastet og indeksert ett uttrekk, kan man kjøre S
149
153
Se Sphinx manualen for mer informasjon.
150
154
151
155
152
-
<aid="orgbe0665b"></a>
156
+
<aid="org580ceb5"></a>
153
157
154
158
# Rapporter
155
159
@@ -159,25 +163,48 @@ formatet: *REPORTS\_DIR\\åååå\MM\DD\TTMMSS\\*. I rapport katalogen
159
163
legges også loggfiler fra indekseringen og indekserings databasen.
160
164
161
165
162
-
<aid="org9f51148"></a>
166
+
<aid="orgeaeeead"></a>
167
+
168
+
# Journaler
169
+
170
+

171
+
172
+
For noen XML strukturer kan det være en 1 til mange relasjon mellom en node i XMLen og filer i arkivpakken. Et eksempel på dette er Norsk Helsearkiv arkivpakker der avlxml filen kan referere til flere digitaliserte sider og tilhørende OCR metadata.
173
+
Denne sammenhengen kan defineres i format filen med nøkkelen *INFO\_VIEW\_JOURNAL\_TYPE\_REGEXP*. Noder som treffer denne nøkkelen vi få en **Journal** knapp nederst i nodeinformasjon visningen.
174
+
Journal visningsmoduset lar brukerene velge ut enkeltsider i journalen som skal eksporteres.
175
+
176
+
177
+
<aid="orgc7f36e1"></a>
178
+
179
+
## Generering av PDF journaler med OCR
180
+
181
+
Journaler støtter visning og eksport av journaler som en *søkbar-PDF*, der hver side består av det digitaliserte bildet (feks en JPG) og den gjenskapte teksten (OCR) som et usynlig lag.
182
+
Støttet OCR format er ALTO og HOCR. For mer informasjon se scriptet *pdf\create-pdf.cmd*. For å generere PDFer kreves det at flere verktøy er installert og tilgjengelig i søkestien:
183
+
184
+
- python: For kjøring av [HocrConverter.py](https://github.com/piql/HocrConverter) som genererer søkbare PDFer.
185
+
-[pdftk](http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/): Slår sammen flere enkeltstående PDF sider til en PDF.
186
+
-[alto\_\_hocr.xsl](https://github.com/filak/hOCR-to-ALTO): XSLT skjema for ALTO til hOCR konvertering
187
+
188
+
189
+
<aid="orgb057092"></a>
163
190
164
191
# Loggfiler
165
192
166
-
-**innsyn-v1.1.0\insight.log**: Applikasjonslogg.
167
-
-**innsyn-v1.1.0\insight.dmp**: Genereres hvis applikasjonen krasjer.
193
+
-**innsyn-v1.2.0\insight.log**: Applikasjonslogg.
194
+
-**innsyn-v1.2.0\insight.dmp**: Genereres hvis applikasjonen krasjer.
168
195
-**REPORTS\_DIR\YYYY\MM\DD\TTMMSS\attachments.log**: Logg over konvertering av vedlegg til søkbare tekstfiler.
169
196
-**REPORTS\_DIR\YYYY\MM\DD\TTMMSS\indexer.log**: Logg fra indekserings applikasjonen som genererer indekserings databasen.
170
197
-**REPORTS\_DIR\YYYY\MM\DD\TTMMSS\sphinx\test1\searchd.log**: Logg fra søkemotoren.
171
198
172
199
173
-
<aid="orge3f57f0"></a>
200
+
<aid="orga6c3ccd"></a>
174
201
175
202
# Konfigurasjon
176
203
177
204
Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på hva som kan konfigureres. Ved endring må applikasjonen restartes. Hvert enkelt filformat har sin egen konfigurasjonsfil. De ligger i mappen *formats*. Alle filene som slutter på *.conf* i denne katalogen vil ved oppstart leses inn og vises som ett eget import format i applikasjonen.
178
205
179
206
180
-
<aid="org838a3b3"></a>
207
+
<aid="orgda63c78"></a>
181
208
182
209
## Tips
183
210
@@ -186,7 +213,7 @@ Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på
186
213
Prøv med `insight -platform windows:dpiawareness=0` for å få riktig størrelse på vinduet. Beskrivelse av andre parametere som tweaker utseendet finnes her: <https://doc.qt.io/qt-5/qguiapplication.html#supported-command-line-options>
187
214
188
215
189
-
<aid="orgb954aa7"></a>
216
+
<aid="orga545d20"></a>
190
217
191
218
# Ønsker, feil og mangler
192
219
@@ -217,50 +244,63 @@ Konfigurasjonsfilen heter *insight.conf*. Se i denne filen for dokumentasjon på
217
244
på disken.
218
245
219
246
220
-
<aid="org2b5254b"></a>
247
+
<aid="orga005c29"></a>
221
248
222
249
# Hvordan rapportere feil
223
250
224
251
ole.liabo@piql.com
225
252
Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis den finnes.
226
253
227
254
228
-
<aid="org407b62e"></a>
255
+
<aid="org5257e0d"></a>
229
256
230
257
# Historikk
231
258
232
259
233
-
<aid="orga0881a0"></a>
260
+
<aid="org3d2dd28"></a>
261
+
262
+
## innsyn-v1.2.0-beta1
263
+
264
+
265
+
<aid="orge2077f0"></a>
266
+
267
+
### Nye funksjoner
268
+
269
+
- Støtte for standard ut mappe ved eksport, settes med konfigurasjonsvariablen *FIXED\_REPORT\_EXPORT\_FOLDER*.
270
+
- Søtte for journaler
271
+
272
+
273
+
<aid="org32bb6f3"></a>
234
274
235
275
## 01.07.2020 innsyn-v1.1.0
236
276
237
277
238
-
<aid="org0845d21"></a>
278
+
<aid="org753c1dc"></a>
239
279
240
280
### Feilrettinger
241
281
242
282
- Opptegning av info nodeinformasjon: Vise all tekst for noder, og likt mellomrom mellom alle noder.
243
283
- Lese inn konfig filer som UTF-8 på Windows.
244
284
245
285
246
-
<aid="org38bccb2"></a>
286
+
<aid="org83201e8"></a>
247
287
248
288
## innsyn-v1.1.0-beta2
249
289
250
290
251
-
<aid="org06f5fd1"></a>
291
+
<aid="org0f72561"></a>
252
292
253
293
### Feilrettinger
254
294
255
295
- Installasjon for Windows.
256
296
257
297
258
-
<aid="org2ef42e5"></a>
298
+
<aid="orgb23408e"></a>
259
299
260
300
## innsyn-v1.1.0-beta1
261
301
262
302
263
-
<aid="org6093bff"></a>
303
+
<aid="orgf87f345"></a>
264
304
265
305
### Nye funksjoner
266
306
@@ -271,22 +311,22 @@ Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis d
271
311
- Støtte for å endre XML-løv noder basert på både node navnet og innholdet i noden.
272
312
273
313
274
-
<aid="org8f0f3df"></a>
314
+
<aid="orga6e94a1"></a>
275
315
276
316
### Feilrettinger
277
317
278
318
- Oppsett av Sphinx indexer og søkemotor på Linux / OS-X.
279
319
- Melding etter konvertering av vedlegg. Får beskjed både om at konvertering feilet og at vedlegg er tomme.
280
320
281
321
282
-
<aid="orgd0434f1"></a>
322
+
<aid="org61c126b"></a>
283
323
284
324
## 2018.06.01 innsyn-v1.0.0
285
325
286
326
-[IKAMR-20180425-02] BUG på norske tegn i søk? Hvis her er norske tegn så virker ikke "Skill mellom små og store bokstaver" som IKKE avkrysset dvs. <fornavn>TORBJØRN</fornavn> vil ikke få treff når jeg søker med "Torbjørn".
287
327
288
328
289
-
<aid="org1c3c3e6"></a>
329
+
<aid="org0e41ff0"></a>
290
330
291
331
## 2018.04.13 innsyn-v1.0.0-rc1
292
332
@@ -309,7 +349,7 @@ Ved feilrapportering legg ved loggfiler og ved programkrasj *insight.dmp* hvis d
309
349
-[IKARO-20180223-01] Jeg har en rekke tidligere kjøringer listet i hovedvinduet når jeg starter opp. Disse er tomme. Hvis jeg prøver å «Åpne» en av disse, så krasjer Insight. Det blir ikke lagt en insight.dmp. Dette skjer hver gang.
310
350
311
351
312
-
<aid="org2ddaace"></a>
352
+
<aid="org0a19c58"></a>
313
353
314
354
## 2018.02.05 innsyn-v1.0.0-beta2
315
355
@@ -331,14 +371,14 @@ Oppdateringer basert på tilbakemeldinger fra IKA-MR, IKA-VA og IKA-Rogaland.
331
371
-[PIQL-20180122-03] Viser størrelsen på vedlegg ved import.
0 commit comments