e
isoverdr chtbee erkhe enni gvoor o e b reo ee veilig ei •ffe e
Deze offerte is uitgebracht aan: NCTV Postbus 16950 2500 BZ Den Haag Klantcontact Naam contactpersoon: Telefoonnummer: E-mail:
Copynght ~ 2011 TNO Alle rechten voorbehouden. Niets uit deze uitgave mag worden vermenigvuldigd entof openbaar gemaakt door middel van druk, foto-kopie, microfilm of op welke andere wijze dan ook, zonder voorafgaande toestemming van TNO.
Offeftenummar. 125707
Kennisoverdracht beeldmerkheskenning voor NCTV
Inhoudsopgave 1 INTRODUCTIE 1.1 1.2
1.3
ACHTERGROND PROBLEEMSTELLING DOELSTELLING
OMSCHRIJVI G VAN HET PROJECT
2
2.1 2.2 2.3 2.4 2.5 2.6 2.7 3
RESULTAAT ACTIViTEITEN 000RLOOPTIJD EN PLANNING PROJECTORGANISATIE RISICO’S VERANTWOORDELIJKHEDEN OPDRACHTGEVER GEEN ONDERDEEL VAN DEZE OFFERTE
PRIJS EN FACTURERING 3.1 3.2
4
PRIJS FACTURERING
LEVERINGSVOORWAARDEN 4.1
4.2 4.3 4.4
VOORWAARDEN GELDIGHEID VAN DE OFFERTE CONTACTPERSONEN ONDERTEKENING
© 2011 TNO
Pagina 2 van 9
3 3 4
5 5 5 6 7 7 7 7
8 8 8 8
8 8 8 9
Offertenummer 125707
1
Kennisove,~racht be&dmerkherkenning voor NC1V
Introduc ie
In deze offerte staat de unieke TNO expertise met betrekking tot beeldmerk ennin centraal. Deze offerte is gebaseerd op gesprekken tussen van NCTV en van TNO. In dit project is de NCTV namens de directie kennis en analyse centrale stakehoider. Tevens heeft afstemming plaats gevonden met het Intemet Service Ceritre van de Belastingdienst. De NCTV (opdrachtgever) heeft het programma genaamd “HERKENNING DIGITALE INFORMATIE EN FINGERPRINTING”, waar binnen de hier voorgestelde technologie een belangrijke rol speelt.
1.1 Achtergrond Verschillende opsporingsdiensten zoeken of monitoren voor hen relevante websites. Door middel van een crawler wordt de inhoud van een website automatisch gekopieerd. Vervolgens wordt op basis van de verkregen informatie vastgesteld of de website relevant is, dan wel of er relevante ontwikkelingen hebben plaatsgevonden. Voor Iedere dienst zullen dit andere websites zijn. De informatie die crawlers op dit moment analyseren is voornamelijk tekst, dle wordt gescheiden van de HTML Indien de informatie wordt gepresenteerd in de vorm van een Flash object of beeldmateriaal, dan wordt deze informatie nog niet of nauwelijks automatisch verwerkt. Deze problematiek is onderzocht in het project Flash Reader. Dit project concludeerde, dat er naast beeldmateriaal met tekst ook ruim 10% van de afbeeldingen op het intemet een beeldmerk of een logo bevat. Vanuit het wetenschappelijk onderzoek naar beeldverwerking en patroonherkenning is de afgelopen tien jaar een technologie volwassen geworden die geschikt is om beeldmerken robuust te herkennen. Er zijn enkele commerciële pakketten beschikbaar, zoals ERSP of Magallen. Daarnaast bevat een open source software pakket als OpenCV al een bibliotheek met deze technologie. Die gebruikt kan worden om websites te classificeren. Dit project onderzoekt de mogelijkheden en onmogelijkheden van deze technologie voor de herkenning van beeldmerken op het internet met de focus op het 00V-domein.
1.2 Probleemstelling Beeldmerkherkenning is een krachtige technologie die sinds enkele jaren operationeel inzetbaar is. Deze “intelligente” technologie biedt In veel gevallen oplossingen, maar werkt niet altijd onder alle omstandigheden. Op dit moment zijn de verwachtingen over de mogelijkheden en onmogelijkheden van deze technologie nog onduidelijk Dit project onderzoekt deze en maakt de grenzen inzichtelijk aan de hand van drie realistische cases uit het 00V-domein. De volgende cases worden uitgewerkt: 1. Herkenning van specifieke togo’s in beeld- of videomateriaal op websites. Een voorbeeld-oase is Anders Breivik, die zich presenteerde omgeven met een aantal togo’s, zoals het Tempelierskruis en een eigen gemaakt beeldmerk. Het probleem om deze logo’s te herkennen wordt veroorzaakt doordat deze togo’s zich bevinden op de achtergrond van foto’s of in aangepaste vormen voor specifieke doeleinden. Deze oase wordt in samenwerking met de NC1V uitgewerkt. 2. Naast fotomateriaal wordt ook onderzocht hoe bijvoorbeeld jihadistische logo’s te herkennen zijn in videomateriaal afkomstig van YouTube. 3. Herkenning van commerciële websites op basis van creditcarclfogo, thuiswinkel- of webshopkeurmerken. Probleem bij deze logo’s is dat ze relatief klein kunnen worden gepresenteerd en zich bevinden in grote aantallen andere afbeeldingen. Deze oase is afkomstig vanuit de samenwerking met de Belastingdienst in het FlashReader project
@ 2011 TNO
Pagina 3 van 9
Offertenummer 125707
Kenn~soverdracht beeldmerkherlconning voor NCW
MaslerCard
t 1
.:‘
15ô4.
AiQaeda
Figuur 1. Drie afbeeldingen dle representatief zijn voor de drie uso-cases. 1.3 Doelstelling Doel van dit proje~ is duidelijke verwachtingen te realiseren met betrekking tot het gebruik van deze technologie voor cases in het 00V-domein. Dit doel wordt bereikt door de cases uit te werken en deze bevindingen te delen met verschillende stakeholders. Figuur 2 presenteert het proces van beeldmerkherkennlng voor use-case 3. De kennlsoverdracht bestaat uit het delen van inzichten met betrekking tot technische middelen en de wijze waarop met deze technologie gewerkt kan worden door gebruikers en ontwikkelaars van oplossingen. Dit resufteest In een realisifach verwachtingspatroon. Deze verwachtingen zijn belangrijk voor elndgebrulkers, maar ook voor beleidsmakers.
~ —— ~
~oa.mcT>
—
——
_
--
N het Internet
——
—
• ~
&GeeoIecteo~d.reI.vantob..fdmot~an~
— —
•
~
4 -~
Relevanto~ébsItes — -w
bc.com ~. .
-~vdetnI ~1
Figuur 2. Schematische weeigave van het t. onderzoeken proces voor u
©2OI1TNO
Pagir~a4van9
Offertenummer~ 125707
Kenn~soverdracht bee!dmerkhekenning voor NCTV
2 Omschrij ing van het project 2.1 Resultaat Resultaat van dit project is tweefedig: Potentiële gebruikers hebben grip op de technologie om beeldmerken automatisch te herkennen door deel te nemen aan een technische sessie. In deze sessie worden de drie use cases uitgewerkt door daadwerkelijk met de technologie te werken. De bevindingen worden gepresenteerd in de vorm van een rapportage en een workshop gericht op beleidsmakers. Doel van de workshop is de verwachtingen omtrent het gebruik van beeldmerkherkenning duidelijk te krijgen. Dit wordt bereikt doordat TNO de mogelijkheden en onmogelijkheden van de technologie inzichteljk maakt aan de hand van de drie use-cases. -
-
Dit resultaat stelt de stakeholders van de NCTV in staat te besluiten of beeldmerkherkenning een oplossing biedt, en zo ja hoe deze oplossing gebruikt kan worden. Het eindrapport is vertrouwelijk voor intern gebruik, door stakeholders van NCTV. Voor elk ander gebruik is vooraf~aande toestemming van TNO benodigd.
2.2 Activiteiten Om tot het bovenstaande resultaat te komen, omvat het project de volgende ac~viteiten: Al. Afstemming met de stakeholders per use-case A2. Deskresearch per case A3. Experimenten uitvoeren met beeldmerkherkenning A4. Bevindingen vastieggen en integreren in de eindrapportage A5. Kennisoverdracht door middel van technische sessie en workshop A6. Projectmariagement Al. Afstemming met de stakeholders per use-case Voor de drie use-cases moet afstemming plaats vinden met de drie stakeholders over: Precieze definitie van de case Verkrijging van representatieve data Individuele terugkoppeling van de resultaten -
-
A2. Deskresearch per case Per case wordt door middel van deskresearch resultaten van andere onderzoekstrajecten in deze context geplaatst. Deze inventarisatie leidt tot een verzameling uit te voeren experimenten per case. A3. Experimenten uitvoeren met beeldmerkherkenning Per casa worden verschillende experimenten uitgevoerd met verschillende tools. Deze experimenten moeten de belangrijkste bevindingen opleveren van dit project. De tools die gebruikt worden voor deze experimenten kunnen ook gebruikt worden tijdens de technische sessie. De uit te voeren experimenten moeten bijvoorbeeld de volgende vragen inzichtelijk maken: Voor welke type afbeeldingen kan op internet gezocht worden naar relevante beelden? Welke tools kunnen daarvoor gebruikt gaan worden stand-alorie tools of technologie uit de cloud, zoals http:llwww.tineye.com of Google images? Welk materiaal wordt niet geïndexeerd en moet lokaal gedownload worden, indexeren en dan doorzoeken? Hoe performen de verschillende tools die beschikbaar zijn in open-source of commercieel voor lokaal zoeken (ERSP, SIFT, SURF, TNO logoherkenning)? -
-
-
-
© 2011 TNO
Pagina 5 van 9
onertenummer~ 125707 -
Kennisovordractit beeIdmerkhe~enning voor NC1V
Wat is de performance voor de ingebrachte use-cases? Verschillende input logo’s? Vuistregels voor kwaliteit herkenning?
Resultaat van deze experimenten Is dat de mogelijkheden en onmogelijkheden duidelijk zijn voor de use-cases met betrekking tot technologie en kwaliteit. A4. Bevindingen vastleggen en integreren in de eindrapportage Als eindresultaat wordt een rapportage geschreven, waarin alle bevindingen worden gepresenteerd met als uitgangspunt dat de experimenten reproduceerbaar zijn. Deze rapportage vormt de basis voor de technische sessie en een workshop. AS. Kennisoverdracht Kenriisoverdracht door middel van een technische sessie en een workshop. De technische sessie wordt georganiseerd door TNO, terwijl de workshop wordt georganiseerd door de NCTV in samenwerking met TNO. A6. Projectmanagement Benodigd projectmanagement voor het realiseren van het projectresultaat, afstemming met NCTV, afstemming met de stakeholders en de organisatie van de technische sessie en de workshop.
2.3 Doorlooptijd en planning Tabel 1 presenteert de doorlooptijd van het project per activiteit. Tabel 1. Doorlooptijd per activiteIt Al A2 A3 A4 A5 A6 Totaal
Geheel project, zwaartepunt eerste 4 weken 4 weken 9 weken 17 weken 4 weken 26 weken 26 weken
Voor de totale projectuitvoering is een doorlooptijd begroot van 26 weken zoals de gedetailleerde projeotpianning in Tabel 2 laat zien.
02011 TNO
Pagina 6 van 9
O~mme~ 125707
T ~.2. Gedetailleerde ptennhrg van de activiteiten t
2
3
4
5
6
~.
~r’~’
~
7
8
91011121314151617181920212223242526
.~
~1’
:‘~ d
I
J’
________
-
d if
~
b d ..&
T~i~~.H•’.
c
-
Uftnodlglngsn verabiren voor workshop en technische sessie Uitvoering van de technische sessie en de workshop jdsoverleg met opdrachtgever Projeotafrondieg Definitieve vaststelling van de cases
De gewenste projectatart Is begin december. 2.4
Projectorganisatie
De projectorganisatie ziet er als volgt uit. TNO heeft de rol van proj elder en projectuitvoerder bij de activiteiten Al tot en met AS. Het pmjectresultaat zal TNO realiseren met twee computer vision experts en een computer vision consultant die tevens de rol van projectleider Invuit. De stakeholders zijn lid van het projectteam door enerzijds het aandragen van cases bij activiteit Al, en anderzijds het beoordelen van de brulkbaarheld van het behaalde resultaat In activiteit AS. Namens de opdrachtgever (NCTV) Is de projectleider lid van het projectteam en medeverantwoordelijk voor de workshop in activiteit AS. Dit beboft afstemming over de invulling, locatie en de uit te nodigen stakeholders. Na afronding van het project zal acceptatie worden gevraagd middels het TNO Protocol van Oplevering. 2.5
Risicos
Een risico bij onderzoek gebaseerd op use-cases, is dat realistische data verbouwelijk is en dus beperkt gebruikt kan worden. Als dit probleem zich voordoet~ dan is er een alternatieve route te volgen, waarbij TNO data van het intemet download en deze in afstemming met de juiste stakeholder aanmerkt als realistische use-case. 2.6
Verantwoordelijkheden opdrachtgever
De opdrachtgever is verantwoordelijk voor de organisatie van het disseminatie proces. Dit bebelt afstemming over de invulling, locatie en de uit te igen atakeholders voor de presentatie van de resultaten. Daarnaast is de rachtgever verantwoordelijk voor de selectie van de relevante stakeholders om de eindrapportage mee te delen.
2.7
Geen onderdeel van deze offerte
De offerte voorziet niet In: • Oplevering van productie software • Documentatie en support bij proof-of-concept software • Organisatie van disseminatie proces
02011 TNO
Pagina 7van 9
Offertenummer: 125707
Kennisoverdracht beeldmerkherkenning voor NCTV
3 Prijs en factu ering 3.1
Prijs
De prijs van de werkzaamheden zal worden gebaseerd o de werkelijk bestede uren en de werkelijk gemaakte materiële kosten. De richtprijs bedraagt exclusief BTW, prijspeil 2011. Het bedrag zal alleen na toestemming vooraf door de opdrachtgever worden overschreden. Bij 70% benutting van de richtprijs zal er overleg met de opdrachtgever plaatsvinden over de afronding (wat nog te doen, tegen welke kosten). Afhankelijk van de wensen van de opdrachtgever kan er een nieuwe richtprijs worden bepaald.
3.2
Facturering
De werkzaamheden zullen maandelijks in rekening worden gebracht op basis van de werkelijk gemaakte uren en kosten. Betalingscondities: binnen 30 dagen na factuurdatum onder vermelding van het factuumummer.
4 Leveringsvoorwaarden 4.1
Voorwaarden
Op deze offerte is het NCTb-TNO protocol van toepassing. Zie hiervoor het schrijven van NCTb van 11 juli 2008 met kenmerk 5555228/08. Indien de NCTV wordt verzocht (in het kader van een WOB verzoek) het eindrapport of andere documenten van belang voor dit project te publiceren, zal de NCTV alvorens tot publicatie over te gaan TNO in de gelegenheid stellen de betreffende documenten te reviewen. Reviewen houdt in dat TNO eigennamen en commercieel vertrouwelijke gegevens onleesbaar maakt
4.2
Geldigheid van de offerte
De offerte is geldig tot 1 december 2011.
4.3
Contactpersonen
Wij verzoeken u vriendelijk om vragen over deze offerte te richten aan de volgende personen: Commercieel contactpersoon
Inhoudelijk contactpersoon
TNO
TNO
02011 TNO
Pagina 8 van 9
Offertenummer
4.4
12~7o ~
Kennisoverdraclit beeldmerkheilcenning voor NCTV
Ondertekening
Wij danken u voor het in ons gestelde vertrouwen en zien graag uw opdrachtbe ondertekend exemplaar van deze offerte tegemoet~ ter attentie van TNO, 98864. 2509 JG Den Haag.
Voor TNO
-
art.)
Naam
Naam
Functie
Functie
Datum en laata
Datum en laata
‘bA~~ (~._
O2OI1TNO
Paginagvang
,~
•
ie
of een .us