Dit onderzoek stelt voor om machine learning algoritmes te gebruiken om de steekproefstrategie voor de Community Innovation Survey te verbeteren door nieuwe gegevensbronnen te integreren. Het onderzoekt het gebruik van web-scraped data, administratieve gegevens en patentinformatie om de weging van de CIS te verbeteren en benadrukt het belang van het balanceren van traditionele en nieuwe gegevensbronnen voor officiële statistieken.