Technologische Neuigkeiten, Bewertungen und Tipps!

Der Tech-Stack hinter dem Zusammenfassungstool des in Bangalore ansässigen Startups Synth

Hinweis: Der folgende Artikel hilft Ihnen dabei: Der Tech-Stack hinter dem Zusammenfassungstool des in Bangalore ansässigen Startups Synth

Auch wenn Lernen und Arbeiten heute digitalisiert sind, sind die Technologien, mit denen diese Informationen auf gleichwertige Weise verarbeitet werden können, immer noch eine Nische. Das in Bangalore ansässige Start-up Synth vereinfacht Videokonferenzen, Teamanrufe und die Weiterqualifizierung durch Videos mit seinem Transkriptions- und Zusammenfassungstool. Ihre persönlichen KI-Assistenten, das „zweite Gehirn“, erfassen alle relevanten Informationen, die durch Text, Audio und Video aufgenommen werden, und fassen sie mit einem Klick zusammen. Das Unternehmen wird von Suneel Matham, Urvin Soneta und Vaibhav Saxena gegründet. Das Analytics India Magazine sprach mit Urvin und Vaibhav, um mehr über ihre Dienstleistungen zu erfahren.

AIM: Was ist das Problem, das Synth zu lösen versuchte?

Urvin: Wir (die Mitbegründer) waren Teil der Plaksha Tech Leaders Fellowship. Während des Batches hatten wir viele Audioinformationen, die wir täglich durchgingen. Während dieser Zeit wurde uns klar, dass alle Informationen, die wir konsumierten, für uns von großem Wert waren, nicht nur für den Zeitplan der Gemeinschaft, sondern auch für uns, sogar in der Zukunft.

Also haben wir drei uns angewöhnt, dieses Wissen ganz einfach zu externalisieren, um später darauf zurückgreifen zu können – wir wollten unser zweites Gehirn haben. Wir haben die vorhandenen Tools ausprobiert, aber die meisten funktionierten nicht gut. Oder sie würden nur für einen Besprechungskontext funktionieren und für den anderen nicht. Wir haben verschiedene Anwendungen getestet, die damit funktionierten, aber keiner von uns fühlte sich damit wirklich wohl. Und wir hatten das Gefühl, dass die gesamte Last des Erfassens, Organisierens und Abrufens von Informationen beim Benutzer und nicht bei der Anwendung liegt. Und da wir uns mit KI beschäftigten, dachten wir, warum nicht versuchen, diese Belastung von den Benutzern zurück auf die Software zu verlagern. Diese Idee wurde also während des Stipendiums gesät, aber dann hatten wir Schlusssteinprojekte (für die das Trio an verschiedenen Orten arbeitete). Als wir zurückkamen, war es Zeit für COVID-19 und wir führten alle unsere Kurse online durch. Es gab diesen Trend, dass alles online ging und aufgezeichnet wurde.

Wir waren in einem zufällig zusammengestellten Team in unserem Produktmanagementkurs bei Plaksha. Wir haben diese Problemstellung ausgewählt und begonnen, darauf hinzuarbeiten. COVID-19 hat uns in gewisser Weise dazu veranlasst, Unternehmertum in einem Umfeld mit geringen Einsätzen auszuprobieren. Das Programm zur Unterstützung des Unternehmertums hat uns zu Beginn die Betreuung durch großartige Leute aus der Start-up-Branche und der VC-Branche ermöglicht, um uns den Einstieg zu erleichtern.

ZIEL: Wie automatisiert Synth monotone Aufgaben?

Vaibhav: Wir machen drei sehr einfache Dinge. Synth erfasst alle Audioinformationen. Es spielt keine Rolle, ob das Meeting im Team stattfindet, Sie sich einen Podcast anhören oder sich durch Zuschauen weiterbilden YouTube Videos; Synth erfasst alle Audioinformationen. Dann fassen wir es für Sie zusammen.

Wie schnell können Sie eine Information auch nach zwei oder drei Monaten verstehen? Und wie schnell kann man danach suchen? Sie haben sich zum Beispiel dieses Video angesehen, in dem Sie etwas vertieft gelernt haben, und darin war eine tolle Idee enthalten. Sie haben es wahrscheinlich irgendwo geschrieben, können es aber nicht herausfinden, weil wir es nie richtig erfasst haben. Synth möchte diese Probleme lösen, indem es Ihre Audioinformationen an einem einzigen Ort erfasst, zusammenfasst und als Text abruft. Sie müssen sich also nicht die Mühe machen, Ihre Besprechungsnotizen oder ähnliches zu finden.

ZIEL: Bitte erläutern Sie den hinter dem KI-Assistenten verwendeten Tech-Stack.

Vaibhav: Synth ist eine Desktop-Anwendung. Der Inhalt ist vollständig in JavaScript, um ihn viel schneller erstellen zu können. Im Backend geschieht im Wesentlichen der größte Teil der Magie. Alle Dinge werden durch Sprachmodelle oder Transformatoren angetrieben. Für uns bilden Sprachmodelle die Grundlage für alles, sei es Transkription, Zusammenfassung oder Retrieval. In diesen Modellen sind viele proprietäre Dinge enthalten; Wir nutzen unsere Daten, trainieren und verfeinern diese Modelle weiter mit den Daten, die wir erhalten, wenn der Benutzer die Anwendung nutzt.

ZIEL: Erzählen Sie uns mehr über die Zusammenfassung.

Vaibhav: Die Zusammenfassung umfasst normalerweise weniger als 500 Wörter und wird unabhängig erstellt. Es ist intelligent genug, um den Kontext und die Wünsche der Person zu verstehen. Und hier kommt die proprietäre Technologie oder die KI-Algorithmen, die wir verwenden, ins Spiel. So versteht es den gesamten Kontext des Meetings oder Videos und präsentiert Ihnen eine Zusammenfassung.

ZIEL: Synth kann für verschiedene Anwendungsfälle verwendet werden. Bitte erläutern Sie einige anhand von Fallstudien.

Urvin: Ein Anwendungsfall besteht darin, dass Menschen es für Besprechungen verwenden. Der zweite Grund ist, dass die Leute es zur Weiterqualifizierung und zum Lernen nutzen. Und das Letzte ist, dass die Leute die Hörbücher und Podcasts, die sie hören, zusammenfassen möchten.

Aus Sicht des Meetings nutzen Gründer und Produktmanager es, insbesondere für die Benutzeranrufe und externen Anrufe, die sie führen; Partneranrufe oder Kundenanrufe. Produktmanager nutzen es für Produktbesprechungen, da es in solchen Fällen hilfreich ist, sich genau auf die Aussage einer bestimmten Person zu konzentrieren. Darüber hinaus erleichtert die Zusammenfassung der Informationen den Mitarbeitern die einfache Weitergabe innerhalb ihrer Teams. (Dies gilt auch, wenn) jemand, der nicht an einer Besprechung teilgenommen hat, um eine kurze Besprechung bittet. (Mit Synth können Kollegen) einfach diese Notizen teilen, um das Gespräch noch einmal zu erleben, und nur die hervorgehobenen Teile in der Zusammenfassung. Es ist zeitsparend.

Um zu veranschaulichen, wie einfach Lernen und Weiterqualifizieren sind, gibt es in den USA einen Datenwissenschaftler, der Inhalte im Bereich Datenwissenschaft erstellen möchte. Aber da sich die Dinge in der Branche immer weiter entwickeln, schaut er sich regelmäßig Two Minute Papers an YouTube und nutzt Synth, um seine Forschung zu konsolidieren, den Prozess zu beschleunigen und diese wichtigen Aspekte zu erfassen. Darüber hinaus hat er Teile wichtiger Notizen über die Ein-Klick-Verknüpfung hervorgehoben, sodass Sie sie während des Anrufs hervorheben können.

ZIEL: Sowohl Vaibhav als auch Urvin haben ihren Bachelor in Kunst gemacht, bevor sie zur KI wechselten. Was bringt der geistes-informatische Hintergrund für das Unternehmen?

Vaibhav: Einer der wichtigen Aspekte beim Unternehmensaufbau ist die Kommunikation und das Verständnis für die Denkweise anderer Menschen. Bei Plaksha war uns klar, dass wir mit unterschiedlichen Menschen zusammenarbeiten würden und dass das Start-up sehr schwach wäre, wenn wir uns nicht in ihre Probleme hineinversetzen könnten. Dies wird durch die Zusammenarbeit mit Designern, verschiedenen Ingenieuren sowie Front- und Back-End-Leuten intensiviert. (Hier erfahren Sie), wie zumindest unsere Ausbildung uns dabei geholfen hat, uns weiterzuentwickeln.

Urvin: Unsere unterschiedlichen Hintergründe und der multidisziplinäre Aspekt, und im größeren Kontext auch die Problemstellung, mit der wir arbeiten, sind ebenfalls sehr multidisziplinär. Wir können sagen, dass wir zur Steigerung der menschlichen Intelligenz beitragen. In diesem Sinne möchten wir sicherstellen, dass das Produkt, das wir bauen, technisch hervorragend funktioniert und sich im Alltag gut in den Menschen einfügt. Auch hier kommt die Bedeutung der Mensch-Computer-Interaktion zum Tragen. Wichtige Aspekte waren mein Hintergrund in den Geisteswissenschaften und die Art der Kurse, die ich in den Bereichen Informatik, Wirtschaft, Geisteswissenschaften und HCI belegt habe. Es hilft uns, den Benutzer auf menschlicher Ebene zu verstehen, ihm aber auch ein Produkt zu bieten, das technisch superstark ist.

ZIEL: Welche verschiedenen Audio-/Video-Softwareprogramme sind mit Synth kompatibel?

Vaibhav: Synth ist mit allem kompatibel; Twitter, Google Meet, Teams, Zoom oder jeder andere Videokonferenz-Client, der in den nächsten zehn Jahren auf den Markt kommen wird, zusammen mit Plattformen wie Coursera oder Udemy. Das größte Problem, das wir lösen wollten, war, warum wir ganz auf ein anderes Tool umsteigen mussten. Da Synth mit fast allem funktioniert, müssen Sie keine neue App installieren oder eine neue App für ein anderes Meeting herunterladen.

ZIEL: Erzählen Sie uns von Ihrem Expansionsplan.

Urvin: Wir haben in den letzten Monaten an einer privaten Betaversion mit einzelnen Benutzern und einzelnen Anwendungsfällen gearbeitet. Derzeit fügen wir unseren Anwendungen Funktionen für die Zusammenarbeit hinzu und werden mit der Einbindung größerer Teams beginnen, um in den nächsten Monaten mit der Arbeit an der privaten Beta zu beginnen. Neben Einzelpersonen werden auch Teams einen erheblichen Nutzen aus Synth ziehen, da es zu einem institutionellen Gedächtnis für Teams und Unternehmen werden kann. Der Plan besteht darin, weiterhin das größtmögliche Feedback von der privaten Beta und den Onboard-Benutzern auf unserer Warteliste zu erhalten. Wir planen, es in ein paar Monaten öffentlich zu veröffentlichen. Im Hinblick auf eine weitere Expansion, insbesondere für die Anwendungsfälle Hörbücher und Podcasts, planen wir, die App auch auf Mobilgeräten und Tablets einzuführen, um mehr Benutzer zu gewinnen und auf diesen Anwendungsfall auszuweiten.

Table of Contents