• DenavitHartemberg@lemmy.pt
    link
    fedilink
    Português
    arrow-up
    4
    ·
    1 year ago

    Penso que no estado actual destas tecnologias este título deva ser mais sensacionalismo que outra coisa. A maneira mais responsável que veria isto a ser aplicado seria:

    Linha de operadores humanos cheia > AI atende e vai recolhendo informações sobre o caso para adiantar trabalho > se entretanto fica um operador disponível, já tem um resumo e só precisa de confirmar.

    Para os casos de não ter nenhum operador disponível durante nenhuma parte da chamada a coisa fica mais complicada, mas o bot pode estar afinado para detectar casos especialmente graves.

    Penso que o grande desafio está mesmo no speech to text e não tanto no dialog manager. Por vezes temos a sensação que funciona tudo muito bem por causa das Siris e Alexas, mas normalmente isto está afinado apenas para uma parte da população (adultos cognitivamente saudáveis, com um discurso comum) não funcionando tão bem para os outros casos: idosos e crianças.

    Para além disso há desafios acrescidos como:

    • Perceber a quem é que a pessoa se está a dirigir - é muito comum alguém que está ao telefone com o 112 fazer ou transmitir perguntas a quem tem ao lado
    • O cocktail party effect - lidar com conversas paralelas, caso o telefone esteja em alta voz.

    Vamos ver, são 2 anos de desenvolvimento e as coisas têm estado a evoluir bem rápido nesta área. Mesmo que o objectivo final não seja atingido, vai haver muita investigação a ser feita e que vai ser útil para todos, por isso acho que é sempre dinheiro bem investido.