Explorar a mineração de conhecimento
Observação Para concluir este laboratório, você precisará de uma assinatura do Azure na qual tenha acesso administrativo.
Vamos imaginar que você trabalhe para a Fourth Coffee, uma rede nacional de cafés. Você ficou encarregado de ajudar a criar uma solução de mineração de conhecimento que facilita a pesquisa de insights sobre as experiências dos clientes. Você decide criar um índice do Azure Cognitive Search usando dados extraídos de avaliações dos clientes.
Neste laboratório, você vai:
- Criar recursos do Azure
- Extrair dados de uma fonte de dados
- Enriquecer os dados com habilidades de IA
- Usar o indexador do Azure no portal do Azure
- Consultar o índice de pesquisa
- Examinar os resultados salvos em um Repositório de Conhecimento
Recursos do Azure necessários
A solução que você criará para a Fourth Coffee exige os seguintes recursos na sua assinatura do Azure:
- Um recurso do Azure Cognitive Search, que gerenciará a indexação e a consulta.
-
Um recurso dos serviços de IA do Azure, que fornece serviços de IA para habilidades que a sua solução de pesquisa pode usar para enriquecer os dados na fonte de dados com insights gerados pela IA.
Observação: os recursos do Azure Cognitive Search e dos serviços de IA do Azure precisam estar na mesma localização.
- Uma Conta de armazenamento com contêineres de blob, que armazena documentos brutos e outras coleções de tabelas, objetos ou arquivos.
Criar um recurso do Azure Cognitive Search
-
Entre no portal do Azure.
-
Clique no botão + Criar um recurso, procure Azure Cognitive Search e crie um recurso do Azure Cognitive Search com as seguintes configurações:
- Assinatura: sua assinatura do Azure.
- Grupo de recursos: selecione ou crie um grupo de recursos com um nome exclusivo.
- Nome do serviço: um nome exclusivo.
- Localização: escolha qualquer região disponível.
- Tipo de preço: Básico
-
Selecione Examinar + criar, após a exibição da mensagem Validação Bem-sucedida e selecione Criar.
-
Após a implantação ser concluída, selecione Ir para o recurso. Na página de visão geral do Azure Cognitive Search, você pode adicionar índices, importar dados e pesquisar índices criados.
Criar um recurso dos serviços de IA do Azure
Precisará provisionar um recurso de serviços de IA do Azure que está na mesma localização que o recurso Azure Cognitive Search. Sua solução de pesquisa usará esse recurso para enriquecer os dados no armazenamento de dados com insights gerados pela IA.
- Retorne à página inicial do portal do Azure. Clique no botão +Criar um recurso e pesquise por serviços de IA do Azure. Selecione criar um plano dos serviços de IA do Azure. Você será levado para uma página para criar um recurso dos serviços de IA do Azure. Defina-o com as seguintes configurações:
- Assinatura: sua assinatura do Azure.
- Grupo de recursos: o mesmo grupo de recursos que o do recurso do Azure Cognitive Search.
- Região: a mesma localização que a do recurso do Azure Cognitive Search.
- Nome: um nome exclusivo.
- Tipo de preço: Standard S0
- Ao marcar esta caixa, confirmo que li e compreendi todos os termos abaixo: selecionada
-
Selecione Examinar + criar. Depois de ver a resposta Validação aprovada, selecione Criar.
- Aguarde a conclusão da implantação e veja os detalhes da implantação.
Criar uma conta de armazenamento
-
Retorne à página inicial do portal do Azure e selecione o botão + Criar um recurso.
- Pesquise conta de armazenamento e crie um Armazenamento de conta com as seguintes configurações:
- Assinatura: sua assinatura do Azure.
- Grupo de recursos: o mesmo grupo de recursos que o dos recursos do Azure Cognitive Search e dos serviços de IA do Azure.
- Nome da conta de armazenamento: um nome exclusivo.
- Localização: escolha uma localização disponível.
- Desempenho: padrão
- Redundância: LRS (armazenamento com redundância local)
-
Clique em Examinar e criar e depois clique em Criar. Aguarde a conclusão da implantação e acesse o recurso implantado.
- Na conta de Armazenamento do Microsoft Azure que você criou, no painel de menu à esquerda, selecione Configuração (em Configurações).
- Altere a configuração de Permitir acesso anônimo ao Blob para Habilitado e, em seguida, selecione Salvar.
Carregar documentos no Armazenamento do Azure
-
No painel de menu à esquerda, selecione Contêineres.
-
Selecionar + Contêiner. Um painel no lado direito será exibido.
- Insira as seguintes configurações e clique em Criar:
- Nome: coffee-reviews
- Nível de acesso público: contêiner (acesso de leitura anônimo para contêineres e blobs)
- Avançado: sem alterações.
-
Em uma nova guia do navegador, baixe os documentos compactados de https://aka.ms/km-documents e extraia os arquivos para a pasta revisões.
-
No portal do Azure, selecione o contêiner coffee-reviews. No contêiner, selecione Carregar.
-
No painel Carregar blob, clique em Selecionar um arquivo.
-
Na janela do Explorer, selecione todos os arquivos na pasta Revisões, selecione Abrir e, em seguida, selecione Carregar.
- Quando o carregamento for concluído, você poderá fechar o painel Carregar blob. Seus documentos estão agora no seu contêiner de armazenamento coffee-reviews.
Indexar os documentos
Quando os documentos estiverem no armazenamento, você poderá usar o Azure Cognitive Search para extrair insights deles. O portal do Azure fornece um assistente de importação de dados. Com esse assistente, você pode criar automaticamente um índice e um indexador para as fontes de dados com suporte. Você usará o assistente para criar um índice e importar os documentos de pesquisa do armazenamento para o índice do Azure Cognitive Search.
-
No portal do Azure, procure o recurso do Azure Cognitive Search. Na página Visão geral, selecione Importar dados.
- Na página Conectar-se aos seus dados, na lista Fonte de Dados, escolha Armazenamento de Blobs do Azure. Preencha os detalhes do armazenamento de dados com os seguintes valores:
- Fonte de dados: Armazenamento de Blobs do Azure
- Nome da fonte de dados: coffee-customer-data
- Dados para extração: Conteúdo e metadados
- Modo de análise: Padrão
- Cadeia de conexão: *selecione Escolher uma conexão existente. Selecione sua conta de armazenamento, selecione o contêiner de coffee-reviews e clique em Selecionar.
- Autenticação da identidade gerenciada: Nenhuma
- Nome do contêiner: essa configuração é preenchida automaticamente depois que você escolhe uma conexão existente.
- Pasta do blob: deixe essa opção em branco.
- Descrição: Avaliações da rede de cafés Fourth Coffee.
-
Selecione Avançar: adicionar habilidades cognitivas (opcional).
-
Na seção Anexar Serviços Cognitivos, selecione o recurso de serviços de IA do Azure.
- Na seção Adicionar enriquecimentos:
- Altere o Nome do conjunto de habilidades para coffee-skillset.
- Marque a caixa de seleção Habilitar OCR e mesclar todo o texto no campo merged_content.
Observação É importante escolher Habilitar OCR para ver todas as opções de campos enriquecidos.
- Verifique se o campo Dados de origem está definido como merged_content.
- Altere o Nível de granularidade de enriquecimento para Páginas (partes de 5.000 caracteres).
- Não selecione Habilitar enriquecimento incremental
-
Selecione os seguintes campos enriquecidos:
Habilidade cognitiva Parâmetro Nome do campo Extrair nomes de localização Locais Extrair frases-chave keyphrases Detectar sentimento sentimento Gerar marcas com base em imagens imageTags Gerar legendas com base em imagens imageCaption
- Em Salvar enriquecimentos em um repositório de conhecimento, selecione:
- Projeções de imagem
- Documentos
- Pages (Páginas)
- Frases principais
- Entities
- Detalhes da imagem
- Referências de imagem
Observação Se um aviso solicitando uma Cadeia de conexão da conta de armazenamento aparecer.
- Selecione Escolher uma conexão existente. Selecione a conta de armazenamento criada anteriormente.
- Clique em + Contêiner para criar um contêiner chamado knowledge-store com o nível de privacidade definido como Privado e selecione Criar.
- Selecione o contêiner knowledge-store e clique em Selecionar na parte inferior da tela.
-
Selecione projeções de blob do Azure: Documento. Será exibida uma configuração do Nome do contêiner com o contêiner knowledge-store preenchido automaticamente. Não altere o nome do contêiner.
-
Selecione Avançar: Personalizar índice de destino. Altere o Nome do índice para coffee-index.
-
Verifique se a Chave está configurada como metadata_storage_path. Deixe Nome do sugestor em branco e Modo de pesquisa preenchido automaticamente.
-
Examine as configurações padrão dos campos de índice. Selecione filtrável em todos os campos que já estão selecionados por padrão.
-
Selecione Próximo: Criar um indexador.
-
Altere o Nome do indexador para coffee-indexer.
-
Mantenha o Agendamento definido como Uma vez.
-
Expanda as Opções avançadas. Verifique se a opção Chaves de codificação de Base 64 está selecionada, pois as chaves de codificação podem tornar o índice mais eficiente.
- Escolha Enviar para criar a fonte de dados, o conjunto de habilidades, o índice e o indexador. O indexador é executado automaticamente e executa o pipeline de indexação, que:
- Extrai os campos de metadados do documento e o conteúdo da fonte de dados.
- Executa o conjunto de habilidades cognitivas para gerar mais campos enriquecidos.
- Mapeia os campos extraídos para o índice.
-
Na metade inferior da página Visão geral do recurso do Azure Cognitive Search, selecione a guia Indexadores. Essa guia mostra o coffee-indexer recém-criado. Aguarde um minuto e selecione ↻Atualizar até que o Status indique êxito.
-
Selecione o nome do indexador para ver mais detalhes.
Consulte o índice
Use o Gerenciador de pesquisa para escrever e testar as consultas. O Gerenciador de pesquisa é uma ferramenta criada no portal do Azure que oferece uma maneira fácil de validar a qualidade de seu índice de pesquisa. Use o Gerenciador de pesquisa para escrever consultas e revisar os resultados em JSON.
-
Na página Visão geral do serviço Pesquisa, selecione Gerenciador de pesquisa na parte superior da tela.
-
Observe como o índice selecionado é o coffee-indexer que você criou.
No campo Cadeia de caracteres de consulta, insira
search=*&$count=true
e selecione Pesquisar. A consulta de pesquisa retorna todos os documentos no índice de pesquisa, incluindo uma contagem de todos os documentos no campo @odata.count. O índice de pesquisa deve retornar um documento JSON contendo os resultados da pesquisa.Observação Se aparecer uma mensagem Para pesquisar no portal, permita a origem do portal nas configurações de CORS do índice, selecione Permitir portal e depois Pesquisar.
-
Agora, vamos filtrar por localização. Insira
search=locations:'Chicago'
no campo Cadeia de caracteres de consulta e selecione Pesquisar. A consulta pesquisa todos os documentos no índice e filtra as análises com uma localização de Chicago. -
Agora, vamos filtrar por sentimento. Insira
search=sentiment:'negative'
no campo Cadeia de caracteres de consulta e selecione Pesquisar. A consulta pesquisa todos os documentos no índice e filtra as análises com um sentimento negativo.Observação Veja como os resultados são classificados por
@search.score
. Essa é a pontuação atribuída pelo mecanismo de pesquisa para mostrar o quanto os resultados correspondem à consulta fornecida. -
Um dos problemas que queremos resolver é o motivo pelo qual pode haver determinadas avaliações. Vamos dar uma olhada nas frases-chave associadas à avaliação negativa. Qual você acha que pode ser a causa da avaliação?
Revisar o repositório de conhecimento
Por fim, vejamos o poder do repositório de conhecimento em ação. Quando você executou o Assistente de importação de dados, também criou um repositório de conhecimento. No repositório de conhecimento, você verá que os dados enriquecidos extraídos por habilidades de IA persistem na forma de projeções e tabelas.
-
No portal do Azure, navegue de volta para a conta de armazenamento do Azure.
-
No painel de menu à esquerda, selecione Contêineres. Selecione o contêiner knowledge-store.
-
Selecione qualquer um dos itens e clique no arquivo objectprojection.json.
-
Selecione Editar para ver o JSON produzido por um dos documentos do seu armazenamento de dados do Azure.
-
Selecione a trilha do blob de armazenamento no canto superior esquerdo da tela para retornar aos Contêineres da conta de armazenamento.
-
Em Contêineres, selecione o contêiner coffee-skillset-image-projection. Selecione um dos itens.
-
Selecione qualquer um dos arquivos .jpg. Selecione Editar para ver a imagem armazenada do documento. Observe como todas as imagens dos documentos são armazenadas dessa maneira.
-
Selecione a trilha do blob de armazenamento no canto superior esquerdo da tela para retornar aos Contêineres da conta de armazenamento.
-
Selecione Navegador de armazenamento no painel à esquerda e escolha Tabelas. Há uma tabela para cada entidade no índice. Selecione a tabela coffeeSkillsetKeyPhrases.
Confira as frases-chave que o repositório de conhecimento conseguiu capturar do conteúdo nas avaliações. Muitos dos campos são chaves, então é possível vincular as tabelas como um banco de dados relacional. O último campo mostra as frases-chave que foram extraídas pelo conjunto de habilidades.
Saiba mais
Essa pesquisa simples indexa apenas algumas das funcionalidades do serviço Azure Cognitive Search. Para saber mais sobre o que você pode fazer com o serviço, confira a página do serviço Azure Cognitive Search.