Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/11531/33879
Título : Development of a Venture Capital Automatic Outbound Sourcing Process to Find and Target Startups Online
Autor : Fenandez Medrano, Sebastian
Orden López, Gonzalo de la
Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)
Fecha de publicación : 2019
Resumen : El propósito de este proyecto es construir un proceso “lean” y escalable para encontrar y cualificar inversiones en etapa pre-semilla en el ecosistema del venture capital europeo a partir de fuentes de datos online. En el Capítulo 1 – Estado del Arte, se puede encontrar una descripción exhaustiva de la situación actual del ecosistema tecnológico europeo, desde el desarrollo de la industria del Venture Capital (VC) en Silicon Valley a su asentamiento en Europa, la riqueza de talento emprendedor en las comunidades tecnológicas europeas, y una presentación de los diferentes procesos de sourcing típicos empleados por firmas de VC para encontrar potenciales startups para sus portfolios, así como las dificultades encontradas en el proceso en hubs tecnológicos tan fragmentados. El capítulo concluirá con una vista general del enfoque empleado en los capítulos siguientes. El Capítulo 2 – Definición de un Pipeline de Ventas, provée la estructura de un pipeline de ventas, proceso empleado típicamente dentro de los equipos de ventas y de marketing con el fin de cualificar y seleccionar oportunidades potenciales, para finalmente convertirlas en oportunidades reales al cerrar la transacción. Este capítulo estudiará y proveerá una estructura y terminología para específica para modelar el proceso de inversión en firmas de VC, por el cuál cada startup pasará a través de una serie de escalones, cada uno de ellos constituyendo un filtro a partir de una serie de criterios. El pipeline construido en este capítulo servirá como estructura sobre la que se creará el proceso de outbound sourcing en los siguientes capítulos. En el Capítulo 3 – Dimensionamiento del Mercado y Metodología de Extracción de Datos, se realiza un análisis de los diferentes tipos de fuentes de startup leads online, tomando especial atención a la calidad de la información, la cantidad de startups encontradas en cada tipo de fuente, y el nivel de representación del ecosistema de la geografía de interés de las fuentes. Crunchbase y Pitchbook, dos bases de datos Premium extensamente empleadas en VC, son evaluadas junto con un conjunto de fuentes de datos públicos que incluirán, entre otras, paginas web de aceleradoras, incubadoras y otras firmas de VC. El capítulo 3 continuará con un estudio de diferentes alternativas para llevar a cabo el “scraping” de datos a partir de las fuentes online, con el fin de extraer la información de una forma automática y sentar las bases de la cualificación automática en el siguiente capítulo. El estudio continuará con un análisis comparativo entre herramientas de “scraping”, incluyendo plugins de buscadores y plataformas incorporadas para este propósito, y bots programados en entornos de desarrollo integrado mediante marcos de programación, como Scrapy y Apify. En el Capítulo 4 – Desarrollo de un modelo de NLP para Clasificar Startup Leads, se provee de un análisis sobre algoritmos y metodologías de machine learning para procesar y clasificar los datos extraidos en el capítulo anterior. En este capítulo se hará especial hicapíe en modelos de análisis de texto (NLP) de acuerdo con la naturaleza de los datos extraidos a partir de las fuentes de datos online. Finalmente, el capítulo proveerá la implementación de un modelo de regresión “Stacking”, que consistirá en una regresión de predicciones de dos modelos base: un modelo de “Naive Bayes” y una red neuronal convolucional. El capítulo terminará con la evaluación y validación de ambos modelos base de forma separada, y su combinación a través del meta-modelo. Finalmente, el Capítulo 5 – Conclusiones, proveerá una visión general del proceso, un análisis de sus ventajas y limitaciones, y las tasas de conversión resultantes para cada escalón del pipeline de inversión.
The purpose of this project is to build a lean and scalable process to find and target prospective pre-seed investments in venture capital from online data sources across Europe. On Chapter 1 – State of the Art, one can find an exhaustive description of the current situation in the European tech ecosystem, from the development of the Venture Capital (VC) industry in Silicon Valley to its settlement in Europe, the entrepreneurial talent richness of its tech communities, as well as a presentation of the different typical sourcing processes employed currently by VC firms, and the difficulties encountered in the process of finding prospective portfolio companies in such fragmented tech hubs. The chapter will conclude with a general overview of the approach to be followed in the subsequent sections. Chapter 2 – Definition of a Sales Pipeline, provides the structure of a sales pipeline, the process typically used within sales and marketing teams to qualify and select prospective opportunities and convert them into real opportunities, finally closed in a transaction. This chapter studies and provides a specific structure and terminology customized to approach the investment process in a VC firm, in which each startup passes through a set of stages, each one containing a set of filtering criteria. The pipeline built in this chapter will serve as a structure in which to build up the outbound sourcing process in the following chapters. On Chapter 3 – Market Sizing and Data Extraction Approach, there is an analysis about different types of online sources of startup leads, taking special consideration in the quality of the information, the quantity of startups found for each kind of source, and the level of representation of the sources as of the startup ecosystem of the geography of interest. Crunchbase and Pitchbook, two premium databases widely used in VC, will be assessed together with a set of public data sources, including websites of accelerators, incubators, and other VCs. Chapter 3 will continue with a study of different alternatives to perform data scraping of the online data sources, to extract the information automatically and be able to qualify it in more detail in the next chapter. The study will continue with a comparative analysis between scraping tools, including browser plugins and built-in platforms, and bots coded in an IDE using different programming frameworks, such as Scrapy and Apify. On Chapter 4 – Development of an NLP model to Classify Startup Leads, there is an analysis about machine learning algorithms and methodologies to process and classify the data extracted in the previous chapter. Here, text analysis (NLP) models will be given a special focus due to the nature of the data extracted from the online data sources. Finally, this chapter will provide an implementation of a stacking regression model, consisting on a regression of predictions from two base learners: a Naïve Bayes model, and a convolutional neural network. The chapter will end up with an evaluation and validation of both base learners separately, and their combination through the meta-learner. Finally, Chapter 5 – Conclusions, will provide a general overview of the process, an analysis of its advantages and limitations, and final conversion rates for each pipeline stage of the investment process.
Descripción : Máster Universitario en Ingeniería Industrial
URI : http://hdl.handle.net/11531/33879
Aparece en las colecciones: H62-Trabajos Fin de Máster

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TFM- de la Orden Lopez, Gonzalo.pdfTrabajo Fin de Máster7,64 MBAdobe PDFVista previa
Visualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.