Palvelin
Uutta:
- Fulltext & OCR: Parannettu kokotekstituki toimistotiedostoille. Kokoteksti poimitaan nyt Apache Tikan avulla. Se tukee kaikkia toimistoformaatteja sekä PDF-tiedostoja. OCR:ää varten käytämme Tesseractia. Tämä toimii useimmille kuvaformaatteille ja toimistoformaatteille (PDF:n kautta). Sivujen renderöinti (PDF:n kautta) toimii nyt kaikissa toimistoformaateissa ja on nyt 10 – 100 kertaa nopeampi kuin versiossa 6.16. Vaihdoimme ppmtopdf:stä mutoolsiin. OCR on oletuksena päällä vain PDF-tiedostoille.
- Tiedostoformaatit: Tuki EPUB-formaatille. Tämä tuodaan toimistoformaattina ja tarjoaa sivujen esikatselut. Renderöinti tehdään Calibren avulla. Tuki myös Canonin CR3-raakamuodolle.
- Termit: Lisätty # tunnistettuihin merkkeihin termeille (kuten _). Tavallisissa teksteissä ”#” on nyt osa termiä. Joten #hashtag säilyy sellaisenaan. Näin ollen tällaisia termejä voidaan hakea token-tilassa. Muutoksen voimaantulo edellyttää olemassa olevien objektien uudelleentallennusta.
Parannettua:
- Metatietojen luku: Ohita ZIP-tietolohko exiftoolista. ZIP-metatietolohko, joka luetaan exiftoolista, voi kasvaa erittäin suureksi (jos ZIP-tiedostossa on paljon tiedostoja) eikä sitä käytetä. Joten ohitamme tämän metatietojen lukemisen yhteydessä. Tämä johtaa kevyempiin metatietoihin per pages.zip-tiedostossa.
- Metatietojen luku: Lisätty technical_metadata.pages DOCX-, DOC- ja PPTX-tiedostoihin (jos asetettu metatietoihin). PPTX-tiedostoissa diojen määrä näytetään sivuina.
- pdf2pages: Tukee csv-, doc-, docx-, odp-, ods-, odt-, ppt-, pptx-, rtf-, txt-, xls-, xlsx-lähdeformaatteja (tarvitsee soffice).
- Docker: Vaihto Alpine Linuxista Debianiin.
- Postgres 17: Debianiin siirtymisen myötä tuemme nyt myös Postgres 17.
- /api/search: Vastaa virheellä, jos date_range-aggregaatiopyynnöt sisältävät tuntemattomia kenttiä, kuten limit ja offset.
- Indeksoija: Poista tiedoston kokoteksti globaalista kokoteksti-indeksistä. Tiedoston kokotekstiä voidaan hakea käyttämällä _linked._asset.metadata_fulltext.
Korjattua:
- /api/db|search: Korjattu tiedoston tilan failed-tilan tulostus. Tämä tila oli virheellisesti indeksoitu virheeksi.
- OAI/PMH: Korjattu include_parents-asetus. include_parents-asetus toimi vain osittain. Tämä päivitys tekee sen toimivaksi GetRecord- ja ListRecords-verbeille.
Käyttöliittymä
- Ylläpitäjän viestit: Lisätty uusi valintaruutu
show_always
ylläpitäjän viesteille. - Piilota lajitteluhallinnassa: Nyt on mahdollista suodattaa kenttiä lajitteluhallinnassa per maski. Uusi maskikenttävalinta hide in sort manager tekee kentän näkymättömäksi lajitteluhallinnassa.
- Ryhmäeditori: Ryhmäeditoriin on lisätty Peruuta-painike.
- Suodattimien kiinnitys: Uusi ominaisuus, joka mahdollistaa suodattimien kiinnittämisen paneelin yläosaan, jotta ne näytetään aina ensimmäisinä. Kiinnitetyt suodattimet säilyvät käyttäjäkohtaisesti.
- Hash-tuki: Lisätty tuki hakutermeille, jotka alkavat # merkillä. Jos merkin # jälkeen oleva merkkijono on numero, haku etsii globaalia objektitunnusta. Muussa tapauksessa tekstiä käytetään normaalina kokotekstihakuna. Automaattisen täydennyksen ehdotukset ovat myös tuettuja tässä tilassa.
- Hakusyötteen asetukset: Lisää uuden painikkeen Hakusyötteen asetukset -paneelin avaamiseen. Ensimmäinen vaihtoehto on ”Sisällytä kokoteksti tiedostoista”, joka mahdollistaa tiedostojen metatietojen kokotekstin haun.
- Massamuokkaus (yksi tietue): Lisätty tuki massamuokata yhtä tietueelle.
- Uudet järjestelmäoikeudet: Lisätty uudet järjestelmäoikeudet sijainnille, varmuuskopioinnille ja laajennusten hallinnalle.
- PDF-luoja: Uusi vaihtoehto on lisätty kuvien sisällyttämiseksi PDF-otsikkoon. Lisäksi Letter-muoto on lisätty sivukokojen luetteloon.