Kirjoitettu 2. Huhtikuuta2. Huhti Oli jo sormi ostonapilla, kun huomasin ettei se ollutkaan teleportteri
Kirjoitettu 13. Huhtikuuta13. Huhti No nyt taisi tärpätä, AI OmniVoice. Selostukset omalla äänellä tekstistä puheeksi, tai sitten vaikka Heikki Kahila, tai kuka ihan tahansa. Ilmaiseksi. 1. Kirjoita teksti 2. Lataa tai anna ääni näyte n. 10 sek 3. Generoi teksti puheeksi Generoitu puhe seuraa tarkasti myös sampplen nopeutta ja tyyliä. Lisäksi siellä on useita säätöjä generoinnille OmniVoice AI ladataan omalle koneelle koneelle ja asettuu hyrräämään Pinokion päälle. Ei siis ole pilvisovellus ja generoinnin voi tehdä vaikka kuinka monta kertaa. Latautuu koneelle vielä tuossa (useampi giga tulossa), niin ei koekäyttöä vielä. Asennus on helppo, jos Pinokio valmiina koneella. Sillä explore ja hakuruutuun OmniVoice ja sitten vain install ja pari muuta kuittausta. https://github.com/pierrunoyt/omnivoice-pinokio
Kirjoitettu 14. Huhtikuuta14. Huhti No nyt on ohjelma sisällä, ei mennyt ihan heittämällä, vaan pukkasi erroria. Laitetaan tähän vähän osviittaa, jos joku kohtaa vastaavia pulmia Korjaustoimena joutui ihan säätämään koodia muutaman lisärivin voimin yrityksen ja erehdyksen kanssa. Pythonia joskus editoinut kai joskus parikymmentä vuotta siten. Nyt meinasi tulla ylimääräistä if-rakenteiden kanssa, kun oli unohtunut niiden sisäinen hierarkian. Muokattava tiedosto löytyi tuollaisen polun päästä C:\pinokio\api\OmniVoice-Pinokio.git\app\app.py Siellä kohtaan: arr = audio[0].squeeze(0) Muokkaus, yllä oleva rivi alla olevaan pätkään: # Käsittele eri palautusformaatit if isinstance(audio, (list, tuple)): arr = audio[0] else: arr = audio # (1, N) → (N,) if hasattr(arr, "shape") and len(arr.shape) > 1 and arr.shape[0] == 1: arr = arr.squeeze(0) # (2, N) → mono if hasattr(arr, "shape") and len(arr.shape) > 1: arr = arr.mean(axis=0) # Tensor → numpy if hasattr(arr, "detach"): arr = arr.detach().cpu().numpy() # Varmista numpy arr = np.asarray(arr) wav = np.clip(arr, -1.0, 1.0) return (sampling_rate, (wav * 32767).astype(np.int16)), "Done." Pari tuntia tuon kanssa meni, mutta nyt hyrrää. Back up toki alkuperäisestä tiedostosta. Testaus Kokeilussa annoin OmniVoicelle n. 10 sek lukunäytteen ja sen jälkeen nappasin copy/paste tekstiä iltapaskoista ja generoin sen. Rouva arveli tehneeni tallenteen mikrofonilla.
Luo uusi käyttäjätili tai kirjaudu sisään