New Inducks data submitted

Fre Juni 30 14:38:17 CEST 2006

On 2006-06-30 19:04, Kjell Croné wrote:
> AB           h1 Aftonbladet
> AB 1938      h3 1938 [issdate:1938]
> 
> AB 19380407 YD 38-02-07    0+                   DD
> AB 19380408aYD 38-02-08    0+                   DD
> AB 19380409aYD 38-02-09    0+                   DD

[issdate:1938] bör väl specificeras lite mer exakt, med alla
publiceringsdata nämnda där:
[issdate:1938-04-07(0207),1938-04-08(0208),...]. Resultatet blir sålunda
att alla YD fr.o.m. YD 38-04-07 och t.o.m. sista som hann publiceras i
Aftonbladet före årsskiftet får [pubdate:1938-04-07], vilket inte är
önskvärt. Fältet [inx] blir också lite krångligare, framför allt om
olika personer indexerat olika delar av året eller om endast vissa delar
av året är indexerade. "0407" i koden visas inte heller på COA, vilket
gör det svårare att identifiera ett faktiskt publiceringsdatum för något
avsnitt om man använder sig av COA. Man kan i och för sig ange detta som
"AB 1938p0407" så tror COA att YD 38-02-07 har publicerats på sida 407 i
publikationen AB 1938. Kanske inte det bästa sättet, men datumet visas i
alla fall.

En annan fråga är sedan hur man ska göra om en och samma tidning
innehåller flera olika Disneyserier i samma nummer (t.ex. både YD och YM).

> Hur som helst, jag tycker inte vi behöver indexera dagstidningar på samma 
> sätt som serietidningar.

Vad är det för krångligt med att indexera dagstidningar på samma sätt
som serietidningar? Ta en titt på hur ett visst nummer är indexerat:

ST19430615   h3 [inx:FEk] [issdate:1943-06-15]
ST19430615a YM 42-12-01    0+                   MM  Posören [code:135]
[changes:text underneath]

Observera att publiceringsdatumet i tidningen förekommer på tre ställen
(2 entrycode, 1 issdate) samt att större delen av uppgifterna är samma
för en större del av tidningarna. Sidantal och titelfigur skiljer sig
inte så ofta och inx är samma för allt man indexerar själv, även årtal
är samma för en väldigt stor mängd tidningar. Om vi skalar bort detta
har vi något sådant här:

0615 1201^Posören [code:135]

Sedan gör man något sådant här:

sed 's/\^/    0+                   MM  /g' tidningar.txt | sed 's/$/
[changes:text underneath]/g' | sed 's/^\(..\)\(..\)
\(..\)\(..\)/ST1943\1\2   h3 [inx:FEk] [issdate:1943-\1-\2]\
ST1943\1\2a YM 42-\3-\4/g'

Och ut kommer ett fullständigt index färdigt att klistras in i se.dbi
utan att man behöver upprepa samma information på flera ställen:

ST19430615   h3 [inx:FEk] [issdate:1943-06-15]
ST19430615a YM 42-12-01    0+                   MM  Posören [code:135]
[changes:text underneath]

Eventuellt kanske man även skulle kunna lagra alla tidningsindex i något
liknande förkortat format på CVS, men jag vet inte om det finns någon
motsvarighet till sed för Windows, så det kanske rör till det hela för
personer som kör DIZNI under Windows (t.ex. Harry).

Stefan