{"id":242,"date":"2025-05-30T10:18:48","date_gmt":"2025-05-30T08:18:48","guid":{"rendered":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/?post_type=chapter&#038;p=242"},"modified":"2025-06-13T16:11:59","modified_gmt":"2025-06-13T14:11:59","slug":"text-to-speech-tts","status":"publish","type":"chapter","link":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/chapter\/text-to-speech-tts\/","title":{"raw":"Text to Speech (TTS)","rendered":"Text to Speech (TTS)"},"content":{"raw":"<h2>Beispiele<\/h2>\r\nHeutzutage (2025) ist der Unterschied zwischen einer menschlichen Stimme und einer computergenerierten Stimme (fast) nicht h\u00f6rbar.\r\n<ul>\r\n \t<li>Eine fr\u00fche Computerstimme klang in etwa wie folgt, abgehakt und metallig:\r\n[audio mp3=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-1.mp3\"][\/audio]<\/li>\r\n \t<li>Eine schon bessere Computerstimme klang so, noch leicht abgehakt und immer noch konstante Tonlage:[audio mp3=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-2-google-extension.mp3\"][\/audio]<\/li>\r\n \t<li>Die Juniper-Stimme von OpenAI ChatGPT mit Betonung und Pausen klingt menschlich:[audio mp3=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Juniper-Stimme.mp3\"][\/audio]<\/li>\r\n<\/ul>\r\n<h2>Die grossen Spr\u00fcnge<\/h2>\r\nWie kam es zu diesen Verbesserungen?\r\n<ul>\r\n \t<li>Rechenpower<\/li>\r\n \t<li><strong>Vom Regelwerk zur Wahrscheinlichkeitsrechnung<\/strong> (mit unglaublichen Datenmengen, die verarbeitet werden k\u00f6nnen, aka LLMs). Linguistisch gesehen: Von der deskriptiven zur preskriptiven Grammatik. ;-)<\/li>\r\n<\/ul>","rendered":"<h2>Beispiele<\/h2>\n<p>Heutzutage (2025) ist der Unterschied zwischen einer menschlichen Stimme und einer computergenerierten Stimme (fast) nicht h\u00f6rbar.<\/p>\n<ul>\n<li>Eine fr\u00fche Computerstimme klang in etwa wie folgt, abgehakt und metallig:<br \/>\n<audio class=\"wp-audio-shortcode\" id=\"audio-242-1\" preload=\"none\" style=\"width: 100%;\" controls=\"controls\"><source type=\"audio\/mpeg\" src=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-1.mp3?_=1\" \/><a href=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-1.mp3\">https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-1.mp3<\/a><\/audio><\/li>\n<li>Eine schon bessere Computerstimme klang so, noch leicht abgehakt und immer noch konstante Tonlage:<audio class=\"wp-audio-shortcode\" id=\"audio-242-2\" preload=\"none\" style=\"width: 100%;\" controls=\"controls\"><source type=\"audio\/mpeg\" src=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-2-google-extension.mp3?_=2\" \/><a href=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-2-google-extension.mp3\">https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Stimme-2-google-extension.mp3<\/a><\/audio><\/li>\n<li>Die Juniper-Stimme von OpenAI ChatGPT mit Betonung und Pausen klingt menschlich:<audio class=\"wp-audio-shortcode\" id=\"audio-242-3\" preload=\"none\" style=\"width: 100%;\" controls=\"controls\"><source type=\"audio\/mpeg\" src=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Juniper-Stimme.mp3?_=3\" \/><a href=\"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Juniper-Stimme.mp3\">https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-content\/uploads\/sites\/90\/2025\/05\/Juniper-Stimme.mp3<\/a><\/audio><\/li>\n<\/ul>\n<h2>Die grossen Spr\u00fcnge<\/h2>\n<p>Wie kam es zu diesen Verbesserungen?<\/p>\n<ul>\n<li>Rechenpower<\/li>\n<li><strong>Vom Regelwerk zur Wahrscheinlichkeitsrechnung<\/strong> (mit unglaublichen Datenmengen, die verarbeitet werden k\u00f6nnen, aka LLMs). Linguistisch gesehen: Von der deskriptiven zur preskriptiven Grammatik. \ud83d\ude09<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Beispiele Heutzutage (2025) ist der Unterschied zwischen einer menschlichen Stimme und einer computergenerierten Stimme (fast) nicht h\u00f6rbar. Eine fr\u00fche Computerstimme klang in etwa wie folgt, abgehakt und metallig: Eine schon bessere Computerstimme klang so, noch leicht abgehakt und immer noch konstante Tonlage: Die Juniper-Stimme von OpenAI ChatGPT mit Betonung und Pausen klingt menschlich: Die grossen [&hellip;]<\/p>\n","protected":false},"author":1,"menu_order":4,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"categories":[],"chapter-type":[],"contributor":[],"license":[],"class_list":["post-242","chapter","type-chapter","status-publish","hentry"],"part":3,"_links":{"self":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapters\/242","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":8,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapters\/242\/revisions"}],"predecessor-version":[{"id":323,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapters\/242\/revisions\/323"}],"part":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/parts\/3"}],"metadata":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapters\/242\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/media?parent=242"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/categories?post=242"},{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/pressbooks\/v2\/chapter-type?post=242"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/contributor?post=242"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/digital.hfh.ch\/sprachetriffttechnologie\/wp-json\/wp\/v2\/license?post=242"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}