HoundDog.ai, una startup que ayuda a los desarrolladores a garantizar que su código no filtre información de identificación personal (PII), salió del sigilo el miércoles y anunció una ronda inicial de 3,1 millones de dólares liderada por E14, Mozilla Ventures y ex/ante, además de una número de inversores ángeles. A diferencia de otras herramientas de escaneo, HoundDog en realidad analiza el código que escribe un desarrollador, utilizando tanto la coincidencia de patrones tradicional como los modelos de lenguaje grande (LLM) para encontrar problemas potenciales.
HoundDog fue fundado por Amjad Afanah, quien anteriormente cofundó DCHQ, que luego fue adquirida por Gridstore (que, para complicar las cosas, luego cambió su nombre a HyperGrid) en 2016. Afanah también cofundó apisec.ai, que aún está en funcionamiento. y correr, y trabajó en la startup de conducción autónoma Cruise. La inspiración para HoundDog surgió durante su tiempo en la startup de seguridad de datos Cyral y hablando con los equipos de privacidad allí, me dijo.
«Cuando estaba en Cyral, teníamos muchos datos», dijo. “Lo que hace Cyral, como muchos otros en el espacio de la seguridad de datos, es centrarse en los sistemas de producción. Le ayudan a descubrir, clasificar sus datos estructurados y sus bases de datos, y luego le ayudan a aplicar controles de acceso. Pero los comentarios abrumadores que seguí escuchando de los equipos de seguridad y privacidad fueron: ‘Sabes, es demasiado reactivo y no se mantiene al día con los cambios en el código base’”.
Entonces HoundDog desplaza este proceso aún más hacia la izquierda. Si bien todavía se encuentra en el flujo de integración continua y aún no en el entorno de desarrollo (aunque eso puede suceder en el futuro), la idea aquí es encontrar posibles fugas de datos antes de fusionar el código. Y lo más importante, HoundDog lo hace observando el código real, no el flujo de datos que produce. «Nuestra fuente de verdad es el código base», dijo Afanah.
Gracias a esto, si un equipo de desarrollo comienza a recopilar números de Seguro Social, por ejemplo, HoundDog levantaría una bandera y advertiría al equipo antes de que el código se fusionara; También alertaría al equipo de seguridad. Después de todo, ese podría ser un problema importante y costoso.
Actualmente, el servicio admite código escrito en Java, C#, JavaScript y TypeScript, así como consultas SQL, GraphQL y OpenAPI/Swagger. El soporte para Python es inminente, afirma la empresa.
Afanah señaló que una herramienta como esta se está volviendo especialmente importante en esta era de código generado por IA, algo de lo que también se hizo eco el CEO de Replit (e inversor ángel de HoundDog), Amjad Masad.
«A medida que un número cada vez mayor de empresas recurren al código generado por IA para acelerar el desarrollo, incorporar las mejores prácticas de seguridad y garantizar la seguridad del código generado se vuelve esencial», dijo Masad. “HoundDog.ai está liderando el camino en la protección de datos PII en las primeras etapas del ciclo de desarrollo, lo que lo convierte en un componente indispensable de cualquier flujo de trabajo de generación de código de IA. Ésta es la razón por la que elegí invertir en esta empresa”.
Sin embargo, el propio HoundDog también utiliza IA. Actualmente depende de los modelos de OpenAI para hacerlo, pero es importante enfatizar que esto es opcional. Los usuarios que se preocupan de que su código salga de sus repositorios privados también pueden optar por confiar únicamente en el escáner de códigos más tradicional de la empresa.
Una parte importante de la propuesta de valor de HoundDog es que puede reducir los costos de cumplimiento para las nuevas empresas gracias a sus capacidades de generación de informes automatizados. El servicio puede generar automáticamente un registro de actividades de procesamiento (RoPA). Para ello, HoundDog utiliza IA generativa para generar estos informes y envía esos datos a OpenAI. El equipo enfatiza que solo los tokens que el servicio ha descubierto a través de su escáner habitual se comparten con OpenAI y que no se comparte el código fuente real.
La compañía ofrece un plan gratuito limitado, con planes pagos a partir de $200 al mes para escanear hasta dos repositorios.