930
IBM Content Collector Versão 2.2 Guia do Administrador S517-9642-01

Guia do Administrador - WordPress.comConfigurando Conectores .....198 Configurando Conectores de Origem ....198 Configurando Conectores de Destino ....215 Configurando Conectores do

  • Upload
    others

  • View
    88

  • Download
    0

Embed Size (px)

Citation preview

  • IBM Content CollectorVersão 2.2

    Guia do Administrador

    S517-9642-01

    ���

  • IBM Content CollectorVersão 2.2

    Guia do Administrador

    S517-9642-01

    ���

  • NotaAntes de utilizar estas informações e o produto suportado por elas, leia as informações nos “Avisos” na página 905.

    Esta edição aplica-se à versão 2.2 do IBM Content Collector (número do produto 5724-V57) e a todos os releases emodificações subsequentes, até que seja indicado de outra forma em novas edições.

    Esta edição substitui a SH12-6914-00.

    © Copyright IBM Corporation 2008, 2010.

  • Índice

    ibm.com e Recursos Relacionados . . viiComo Enviar Comentários . . . . . . . . . viiiEntrando em Contato com a IBM . . . . . . . viii

    Parte 1. Visão Geral da Solução . . . 1

    Visão Geral do Content Collector . . . . 3O que Há de Novo noContent Collector Versão 2.1.1? 6O que Há de Novo no Content Collector Versão 2.2? 8

    Visão Geral da Arquitetura do ContentCollector . . . . . . . . . . . . . . 15Definição do Modelo de Dados de Armazenamento 17

    Cenários de Arquivamento deDocumentos . . . . . . . . . . . . 25Cenário: Arquivamento de Documentos paraPropósitos de Armazenamento . . . . . . . . 25Cenário: Arquivando E-mail de Diário . . . . . 26Cenário: Retenção e Disposição de Documento . . 27Cenário: Preparando o Repositório de E-mail paraAnalíticas de E-mail . . . . . . . . . . . 28

    Parte 2. Instalando. . . . . . . . . 31

    Instalando o Content Collector . . . . 33Pré-requisitos para a Instalação . . . . . . . . 33

    Pré-requisitos de Hardware . . . . . . . . 33Pré-requisitos de Software . . . . . . . . 34Pré-requisitos Adicionais e Restrições . . . . . 36

    Listas de Verificação da Configuração . . . . . 38Lista de Verificação de Configuração para osSistemas de Origem Content Collector . . . . 39Lista de Verificação de Configuração paraSistemas de Repositório do Content Collector . . 44Lista de Verificação de Configuração para oBanco de Dados de Configuração do ContentCollector . . . . . . . . . . . . . . 49Lista de Verificação de Configuração para osConectores do Content Collector . . . . . . 51Listas de Verificação de Configuração para asConfigurações Gerais do Content Collector . . . 58

    Instalando o Content Collector de Acordo com suasNecessidades . . . . . . . . . . . . . . 64

    Instalando o Content Collector para Uso com umou mais Sistemas de Origem e o ContentManager . . . . . . . . . . . . . . 65Instalando o Content Collector para Uso com umou mais Sistemas de Origem e o FileNet P8 . . 67Instalando o Content Collector em VáriosServidores - Scale out . . . . . . . . . . 68

    Etapas de Instalação . . . . . . . . . . . 69

    Instalando o Suporte de Procura de Texto doContent Collector . . . . . . . . . . . 69Instalando o Content Collector para MicrosoftSharePoint . . . . . . . . . . . . . . 70Instalando o Content Collector Notes ClientExtension . . . . . . . . . . . . . . 72Instalando o Content Collector Server . . . . 74Executando a Configuração Inicial . . . . . . 76Verificando e Ajustando as Definições deConfiguração Iniciais . . . . . . . . . . 89Configurando as Variáveis de Ambiente doContent Collector . . . . . . . . . . . 91Instalando o Content Collector em VáriosServidores . . . . . . . . . . . . . . 96Configurando o Servidor de Aplicativos da Web 103Substituindo o Modelo de Correio do LotusNotes em Todas as Caixas de Correio . . . . 116Instalando o Content Collector OutlookExtension . . . . . . . . . . . . . . 117Ativando Repositórios Off-line para Permitir oAcesso ao Conteúdo Arquivado sem Acesso àRede . . . . . . . . . . . . . . . 119Instalando e Configurando o Suporte doContentCollector Outlook Web App (previamenteOutlook Web Access) . . . . . . . . . . 122Iniciando, Parando e Atualizando o Centro deInformações Instalado . . . . . . . . . 134

    Removendo o Content Collector . . . 137

    Parte 3. Migrando. . . . . . . . . 139

    Migrando para o Content Collector 141Atualizando para a Versão 2.2 do Content Collector 141

    Fazendo upgrade das rotas de tarefas do FileNetP8 . . . . . . . . . . . . . . . . 144

    Movendo do CommonStore para o ContentCollector . . . . . . . . . . . . . . . 145

    Estratégias de Atualização Legadas . . . . . 148Instalando o Content Collector em um ServidorSeparado . . . . . . . . . . . . . . 150Instalando o Content Collector nos ServidoresCommonStore . . . . . . . . . . . . 151Instalando o Content Collector em um NovoServidor e Incluindo Manualmente aFuncionalidade do CommonStore . . . . . 152Configurando o Suporte Legado do ContentCollector para CommonStore para ExchangeServer . . . . . . . . . . . . . . . 153Configurando Suporte de Legado paraDocumentos Arquivados Usando oCommonStore para Lotus Domino . . . . . 158Ativando o Acesso aos Dados Arquivados paraTipos de Itens Legados . . . . . . . . . 160

    © Copyright IBM Corp. 2008, 2010 iii

  • Movendo do FileNet Email Manager ou FileNetRecords Crawler para o Content Collector . . . . 161Movendo do FileNet Connector para MicrosoftSharePoint Document Libraries para o ContentCollector . . . . . . . . . . . . . . . 163

    Parte 4. Configurando . . . . . . 167

    Configurando o Content Collector . . 169O Gerenciador de Configuração . . . . . . . 169

    Ativando a Segurança no Gerenciador deConfiguração . . . . . . . . . . . . 170Sinalizando mudanças no banco de dados deconfiguração. . . . . . . . . . . . . 171Incluindo, Alterando ou Excluindo Objetos deConfiguração no Gerenciador de Configuração . 172Comandos do Teclado para o Gerenciador deConfiguração . . . . . . . . . . . . 172

    Configurando um Banco de Dados deConfiguração . . . . . . . . . . . . . 184

    Incluindo ou Editando Conexões doArmazenamento de Dados . . . . . . . . 185Excluindo uma Conexão do Armazenamento deDados . . . . . . . . . . . . . . . 187Exportando ou Importando um Banco de Dadosde Configuração . . . . . . . . . . . 187

    Iniciando o Task Routing Engine . . . . . . . 187Configurando o Serviço de Rota de Tarefa . . . 188Verificando se o Content Collector Está emExecução . . . . . . . . . . . . . . 190Configurando as Definições para ConsultasLDAP Durante o Processamento da Rota deTarefa . . . . . . . . . . . . . . . 191Serviços do Content Collector . . . . . . . 192

    Configurando Conectores . . . . . . . . . 198Configurando Conectores de Origem . . . . 198Configurando Conectores de Destino . . . . 215Configurando Conectores do Utilitário . . . . 226Mudando a Conta do Usuário de um Serviço 229

    Definindo Configurações Gerais . . . . . . . 236Configurando o Suporte Legado do ContentCollector para CommonStore para ExchangeServer . . . . . . . . . . . . . . . 236Modificando as Definições do Serviço da Webde Configuração . . . . . . . . . . . 240Modificando as Definições do Centro deInformações . . . . . . . . . . . . . 242Modificando as Configurações para o Aplicativoda Web . . . . . . . . . . . . . . 242Modificando Definições de Configuração doCliente . . . . . . . . . . . . . . 244Configurando o Acesso a Dados Arquivados 245Verifique as Configurações para o MetadataWeb Application . . . . . . . . . . . 251Selecionando o Modelo de Formulário deMetadados . . . . . . . . . . . . . 252Configurando a Definição de Formulário deMetadados . . . . . . . . . . . . . 253

    Incluindo e Editando Metadados . . . . . . . 256Incluindo, Editando e Classificando Listas . . . 257

    Incluindo e Editando Metadados Definidos peloUsuário . . . . . . . . . . . . . . 258Incluindo e Editando Metadados do Sistema deArquivos . . . . . . . . . . . . . . 260Selecionando os Metadados do Sistema. . . . 265

    Configurando Rotas de Tarefa . . . . . . . . 291Rotas de Tarefa . . . . . . . . . . . . 291Trabalhando com Rotas de Tarefa. . . . . . 293Configurando Rotas de Tarefa a partir deModelos . . . . . . . . . . . . . . 306Trabalhando com o Editor de Expressão . . . 437Usando Funções de Processamento Estendidas 465Coletando Documentos para Processamento . . 494Configurando Tarefas. . . . . . . . . . 529

    Usando as Ferramentas de Configuração . . . . 621Configurando um Repositório do IBM ContentManager . . . . . . . . . . . . . . 622Configurando o Ambiente do Domino paraContent Collector . . . . . . . . . . . 627Ativando um Modelo do Domino paraArquivamento . . . . . . . . . . . . 628Ativando um Repositório do IBM ContentManager para Processamento pelo Indexadorpara Procura de Texto . . . . . . . . . 629Configurando um Repositório do IBM FileNetP8 . . . . . . . . . . . . . . . . 630

    Ativando o Acesso aos Dados Arquivados. . . . 632Ativando um Repositório do IBM ContentManager para Procura . . . . . . . . . 633Ativando um Armazenamento de Objeto doIBM FileNet P8 para Pesquisa . . . . . . . 733Sobre Coletas . . . . . . . . . . . . 738Ativando a Procura por Documentos de E-mail 756Ativando o Acesso aos Dados Arquivados paraTipos de Itens Legados . . . . . . . . . 771Alterando o Formato de Exibição do Valor deData . . . . . . . . . . . . . . . 773Configurando um Intervalo de Data Padrãopara a Página Procura de E-mail . . . . . . 774Alterando o Modo de Visualização para Outlook 774

    Manipulando Documentos Errados . . . . . . 775Lista de bloqueio . . . . . . . . . . . 776Ativando Links do Microsoft Outlook . . . . 778

    Protegendo Comunicações do Content Collector 779Substituindo Certificados para o Servidor deAplicativos da Web integrado . . . . . . . 779Comunicação do Cliente. . . . . . . . . 782Proteção de URL . . . . . . . . . . . 782

    Parte 5. Tutoriais . . . . . . . . . 785

    Tutoriais do Sistema de Arquivos doContent Collector . . . . . . . . . 787Arquivando Documentos do Sistema de Arquivosno FileNet P8 . . . . . . . . . . . . . 787

    Movendo Documentos Fora da Rede para o IBMFileNet P8 . . . . . . . . . . . . . 787

    iv Guia do Administrador

  • Detectando e Processando Duplicatas,Procurando Documentos Arquivados eApontados no Repositório e DeclarandoDocumentos como Registros . . . . . . . 789Definindo Metadados para Serem Usados paraProcessar Arquivos para Arquivamento. . . . 791

    Parte 6. Desenvolvendo . . . . . . 793

    Desenvolvendo com as APIs do IBMContent Collector . . . . . . . . . 795Desenvolvendo com as APIs de Serviços doContent Collector Aplicativo da Web . . . . . 795

    Criando Solicitações para ArquivamentoInterativas . . . . . . . . . . . . . 796RestoreAPI . . . . . . . . . . . . . 800ViewingAPI . . . . . . . . . . . . . 803Ativando a Segurança para as APIs de Serviçosdo Aplicativo da Web . . . . . . . . . 805

    Desenvolvendo com o Visualizador de Documento 810Os arquivos de configuração do Visualizador deDocumento . . . . . . . . . . . . . 811Pedidos do Visualizador de Documento . . . 815Configurando o Workplace ou o Workplace XTpara a utilização do Visualizador de Documento 817

    Parte 7. Monitoramento . . . . . . 821

    Monitorando o Desempenho doSistema Content Collector . . . . . . 823Usando o Painel do Sistema . . . . . . . . 823

    Informações Monitoradas no Painel do Sistema 824Usando Contadores de Desempenho . . . . . 825

    Contadores de Desempenho . . . . . . . 826Rastreando Arquivos de Log do Sistema . . . . 829

    Quais Logs Controlar. . . . . . . . . . 829Formato de Arquivo e Convenções deNomenclatura para Mensagens de Log doSistema no Content Collector . . . . . . . 834Níveis de Registro . . . . . . . . . . . 835

    Usando Logs de Auditoria . . . . . . . . . 836Usando Logs de Eventos . . . . . . . . . 837

    Interpretando Logs de Eventos . . . . . . 838Excluindo Logs de Eventos . . . . . . . . 838IDs de Evento . . . . . . . . . . . . 839

    Parte 8. Usando o . . . . . . . . 841

    Usando o Content Collector . . . . . 843Procurando, Visualizando e RestaurandoDocumentos . . . . . . . . . . . . . . 843

    Acessando E-mail Arquivado . . . . . . . 843Alterações nos Documentos Arquivados . . . 853Configurando a Visualização noIBM FileNetWorkplace XT . . . . . . . . . . . . 854

    IBM Content Collector Outlook Extension . . . . 855Instalando um Certificado Autoassinado paraAutenticação de Servidor . . . . . . . . 855

    Arquivando o Conteúdo da Mensagem. . . . 857Restaurando o Conteúdo Arquivado. . . . . 858Especificando Informações de ArquivamentoAdicionais . . . . . . . . . . . . . 859Sinalizando Mensagens para Fragmentação . . 860Especificando Opções de Configuração . . . . 860Procurando em Archives . . . . . . . . 863Ativando Repositórios Off-line no MicrosoftExchange . . . . . . . . . . . . . . 864

    Parte 9. Resolução de Problemase Suporte . . . . . . . . . . . . 867

    Resolução de Problemas do ContentCollector . . . . . . . . . . . . . 869Recuperando Informações de Versão. . . . . . 869Resolução de Problemas de Instalação . . . . . 869

    Resolução de Problemas do Modo de Expansão 869A Instalação do Aplicativos da Web Falhou . . 871A Criação do Banco de Dados de Configuraçãodo Content Collector no Servidor Remoto Falha . 871Usando uma Versão do DB2 Diferente para oBanco de Dados de Configuração em umServidor Remoto para a Versão Instalada noServidor Content Collector . . . . . . . . 872A Conexão com o Banco de Dados Oracle Falha 872Usando o DB2 Data Server Client Versão 9.5 FixPack 1 ou 2 . . . . . . . . . . . . . 873Problemas de Memória ao Executar aConfiguração Inicial ou as Ferramentas deConfiguração . . . . . . . . . . . . 873O Servidor CommonStore e as Tarefas do CSLDFalham ao Iniciar . . . . . . . . . . . 874

    Resolução de Problemas de Configuração . . . . 875Resolução de Problemas de Sistemas de Origem 875Resolução de Problemas de Repositórios deDestino . . . . . . . . . . . . . . 882Resolução de Problemas de Componentes . . . 884Resolução de Problemas de Rotas de Tarefa . . 888

    Resolução de Problemas do Indexador paraProcura de Texto . . . . . . . . . . . . 888

    Configuração Incorreta do Net Search Extender 888O Tipo de Item Não Pode Ser Processado poruma Ferramenta do Indexador . . . . . . 890Uma Biblioteca do DB2 Nativa Não Pode SerCarregada . . . . . . . . . . . . . 890Diretório de Instalação do DB2 Não Pode SerLocalizado . . . . . . . . . . . . . 891Nenhum Índice é Localizado Após o Índice serRecriado . . . . . . . . . . . . . . 892O Net Search Extender Para Inesperadamentesem Emitir um COMMIT . . . . . . . . 892O Net Search Extender Falha Enquanto oProcesso Indexador Está em Execução . . . . 893O Processo Indexador Para por que a UDFAFUFetchFile não Pode Ser Acessada . . . . 893Obtendo o Número da Porta do DB2 . . . . 894Usando Instruções SQL que São Muito Longasou Complexas . . . . . . . . . . . . 895

    Índice v

  • Usando uma Configuração de JDBC Incorretapara os Processos do Indexador . . . . . . 895O Driver JDBC Tipo 2 não Pode Ser CarregadoCorretamente . . . . . . . . . . . . 896Itens com Conteúdo Textual Maior do que 1 MBNão São Indexados ao Usar o DB2 V9.5 . . . 896O Processo Indexador Para por que o Índice nãoPode Ser Localizado . . . . . . . . . . 897Alterações nas Configurações de Diretório eNome do Arquivo Padrão da Configuração daUDF AFUFetchFile . . . . . . . . . . 897Erro ao Acessar Arquivos XML na UDFafuFetchFile . . . . . . . . . . . . . 899

    Erro ao acessar os arquivos XML na UDF doafuFetchFile se o ID do item consistir em pontosde interrogação . . . . . . . . . . . . 900O Processo Trabalhador do Indexador ParaIndicando uma Situação de Falta de Memória . 900

    Parte 10. Apêndices . . . . . . . 903

    Avisos . . . . . . . . . . . . . . 905

    Índice Remissivo . . . . . . . . . . 909

    vi Guia do Administrador

  • ibm.com e Recursos Relacionados

    O suporte e documentação do produto estão disponíveis em ibm.com.

    Suporte e Assistência

    O suporte ao produto está disponível na web. Basta clicar em Suporte no Web sitedo produto apropriado.

    IBM® Content Collectorhttp://www-01.ibm.com/software/data/content-management/content-collector/

    IBM Email Archive and eDiscovery Solutionhttp://publib.boulder.ibm.com/infocenter/email/v2r2m0/index.jsp

    IBM CommonStore para Exchange Serverhttp://www.ibm.com/software/data/commonstore/exchange/

    IBM CommonStore para Lotus Dominohttp://www.ibm.com/software/data/commonstore/lotus/

    IBM Content Managerhttp://www.ibm.com/software/data/cm/cmgr/mp/

    IBM FileNet P8http://www.ibm.com/software/data/content-management/filenet-p8-platform/

    IBM Enterprise Recordshttp://www.ibm.com/software/data/content-management/filenet-records-manager/

    IBM Records Managerhttp://www.ibm.com/software/data/cm/cmgr/rm/

    IBM WebSphere Application Serverhttp://www.ibm.com/software/webservers/appserv/was/

    Lotus Notes and Dominohttp://www.ibm.com/software/lotus/notesanddomino/

    Centro de informações

    É possível visualizar a documentação do produto IBM Content Collector em umcentro de informações baseado no Eclipse. Consulte o centro de informações emhttp://publib.boulder.ibm.com/infocenter/email/v2r2m0/index.jsp.

    Publicações em PDF

    É possível visualizar uma versão em PDF do guia de instalação e configuração doIBM Content Collector usando o Adobe® Acrobat Reader para seu sistemaoperacional. O guia está disponível no IBM Publications Center. Se você não tiver oAcrobat Reader instalado, poderá fazer download dele a partir do Web site daAdobe em http://www.adobe.com.

    © Copyright IBM Corp. 2008, 2010 vii

    http://www-01.ibm.com/software/data/content-management/content-collector/http://www-01.ibm.com/software/data/content-management/content-collector/http://publib.boulder.ibm.com/infocenter/email/v2r2m0/index.jsphttp://www.ibm.com/software/data/commonstore/exchange/http://www.ibm.com/software/data/commonstore/lotus/http://www.ibm.com/software/data/cm/cmgr/mp/http://www.ibm.com/software/data/content-management/filenet-p8-platform/http://www.ibm.com/software/data/content-management/filenet-p8-platform/http://www.ibm.com/software/data/content-management/filenet-records-manager/http://www.ibm.com/software/data/content-management/filenet-records-manager/http://www.ibm.com/software/data/cm/cmgr/rm/http://www.ibm.com/software/webservers/appserv/was/http://www.ibm.com/software/lotus/notesanddomino/http://publib.boulder.ibm.com/infocenter/email/v2r2m0/index.jsphttp://www.adobe.com

  • Como Enviar ComentáriosSeu feedback é importante para ajudar a fornecer as informações mais precisas ecom a mais alta qualidade.

    Envie seus comentários usando o formulário on-line de comentários do leitor emhttps://www14.software.ibm.com/webapp/iwm/web/signup.do?lang=en_US&source=swg-rcf.

    Entrando em Contato com a IBMPara entrar em contato com o atendimento ao cliente IBM nos Estados Unidos ouCanadá, ligue para 1-800-IBM-SERV (1-800-426-7378).

    Para informações sobre opções de serviços disponíveis, ligue para um dosseguintes números:v Nos Estados Unidos: 1-888-426-4343v No Canadá: 1-800-465-9600

    Para obter informações adicionais sobre como entrar em contato com a IBM,consulte o Web site da IBM em http://www.ibm.com/contact/us/.

    viii Guia do Administrador

    https://www14.software.ibm.com/webapp/iwm/web/signup.do?lang=en_US&source=swg-rcfhttps://www14.software.ibm.com/webapp/iwm/web/signup.do?lang=en_US&source=swg-rcfhttp://www.ibm.com/contact/us/

  • Parte 1. Visão Geral da Solução

    © Copyright IBM Corp. 2008, 2010 1

  • 2 Guia do Administrador

  • Visão Geral do Content Collector

    O IBM Content Collector arquiva e-mail e outro conteúdo digitizado em umrepositório central externo. Funções adicionais permitem que os usuários reduzamo tamanho de suas caixas de correio, reivindiquem espaço em seus discos rígidos eservidores Microsoft® SharePoint, procurem conteúdo no repositório e restaureme-mail arquivado em seus locais originais.

    ArquivamentoÉ possível arquivar o conteúdo a partir de várias origens. Elas incluem:v Caixas de correio nos servidores Lotus Domino ou Microsoft Exchangev E-mail que é recebido através do Simple Mail Transfer Protocol (SMTP)v Pastas públicas e arquivos PST do Microsoft Exchangev Aplicativos Lotus Domino e archives NSF locaisv Sites do Microsoft SharePointv Documentos nos sistemas de arquivos NTFS, DFS e NovellO arquivamento significa que o conteúdo desses documentos é processadoe, em seguida, armazenado em um repositório central.

    Terminologia: O IBM Content Collector usa documentos como um termogenérico para e-mail, mensagens, documentos do Microsoft SharePoint edocumentos do sistema de arquivos.

    O repositório central fornece um ponto de acesso único para todos osdocumentos relevantes aos negócios, significando que os dadosconfidenciais podem ser melhor controlados. Vários recursos de segurançaestão em vigor para a proteção dos documentos de negócios.

    Os métodos de arquivamento incluem o arquivamento automático einterativo.v Arquivamento automático significa que um administrador configura

    centralmente uma programação de arquivamento e seleciona as origens apartir das quais arquivar o conteúdo, tais como clientes de e-mailconectados, aplicativos, grupos de usuários, servidores, sites doMicrosoft SharePoint ou sistemas de armazenamento.

    v O arquivamento interativo no lado do cliente permite que usuários dosclientes Notes e Outlook sinalizem documentos para arquivamento.Documentos sinalizados por usuários do cliente de e-mail sãoselecionados para arquivamento na próxima vez que o processo dearquivamento planejado é executado. Os usuários também podemespecificar informações de arquivamento adicionais antes doarquivamento dos documentos.

    O IBM Content Collector sempre arquiva o conteúdo de e-mail inteiro,incluindo os anexos. É possível configurar quais partes serão removidas dodocumento original após seu arquivamento e quando isto ocorrerá. Vocêpode selecionar os documentos de todos os clientes de correio conectados,ou de apenas um subconjunto, de acordo com os critérios predefinidos,como o tamanho do banco de dados de correio, a idade dos documentos,etc.

    É possível copiar ou mover documentos de múltiplos sites do MicrosoftSharePoint, de um único site ou de bibliotecas e listas selecionadas

    © Copyright IBM Corp. 2008, 2010 3

  • suportadas. É possível filtrar a coleta de archive com base nos tipos deconteúdo ou por meio de filtros adicionais da rota de tarefa, e mapearcolunas do site customizadas para metadados correspondentes em seurepositório.

    Os documentos do sistema de arquivos podem ser processadosdependendo dos metadados e armazenados em uma estrutura de pasta derepositório específica para facilitar a procura e a recuperação.

    Acessando o ConteúdoAs funções visualizar e restaurar permitem que os usuários do clientevisualizem e restaurem documentos arquivados do repositório central,principalmente em casos nos quais o conteúdo arquivado foi removido dosdocumentos originais. Os usuários do cliente podem acessar o materialarquivado através dos links e pontos de acesso fornecidos nos documentosde stub no caso de e-mail, através de links diretos no caso de sistema dearquivos ou documentos do Microsoft SharePoint ou através de umainterface de procura baseada na Web.

    No IBM Content Collector, o acesso ao conteúdo arquivado é restrito. Parae-mail, o acesso a um link é fornecido pela segurança da caixa de correiodo usuário, significando que o usuário verá apenas o que a caixa decorreio permite. Para sistema de arquivos e Microsoft SharePoint, o acessoa um link é determinado pelo acesso do usuário ao local do documento nosistema de arquivos ou na biblioteca de documentos do SharePoint.

    O acesso ao conteúdo do documento também é possível ao usar um clientede repositório, seja personalizados pelo cliente ou prontos para utilização,onde as credenciais de um usuário do repositório são aplicadas comrelação à segurança de um documento para determinar o acesso. No IBMContent Collector, o sistema de arquivos ou os links do SharePoint tambémpodem ser definidos como links seguros. Clicar em um link seguro solicitaao usuário permissões do usuário específicas para visualizar o conteúdo dodocumento.

    Para remover o conteúdo do e-mail restaurado no IBM Content Collector,você pode definir um planejamento. Este processo é referido comoreapontamento do documento no repositório.

    Procurar (e-mail)O assistente de instalação do IBM Content Collector inclui uma interfacede pesquisa para os clientes do Lotus Notes ou Outlook conectados. Apartir desta interface, os usuários podem iniciar pesquisas completas detexto para pesquisar por um conteúdo arquivado. O conteúdo dos anexosarquivados é incluído na pesquisa.

    Por motivos de segurança, o recurso de pesquisa é limitado. Os usuáriosde arquivamento podem pesquisar apenas o conteúdo que foi arquivadoem sua caixa de correio. Eles não podem pesquisar ou restaurar oconteúdo pertencente a outros usuários. Entretanto, eles podem pesquisar oconteúdo que foi arquivado das caixas de correio às quais eles possuem“acesso delegado”. Por exemplo, se acesso à caixa de correio de umgerenciador foi delegado a um assistente, ele pode procurar por conteúdoque foi arquivado a partir dessa caixa de correio. De forma semelhante, osusuários podem procurar o conteúdo que foi arquivado a partir dequalquer arquivo PST do Microsoft Exchange que foi designado a elesantes de ser arquivado.

    Os usuários também podem procurar metadados de e-mail. Estas sãoinformações que residem em campos do e-mail original, tal como o campo

    4 Guia do Administrador

  • emissor, destinatário ou assunto. As informações nestes campos sãoextraídas durante a operação de arquivamento e armazenadas em camposcorrespondentes no repositório. É possível customizar a lista de campos dee-mail da qual você deseja extrair metadados. É importante lembrar que aspesquisas de metadados requerem que o usuário possua um entendimentoaprofundado dos dados nesses campos.

    Também há uma função de visualização. Se um documento parecerpromissor na lista de resultados, um usuário poderá selecioná-lo paraexibir seu conteúdo em uma janela do navegador da Web. O texto deprocura é realçado. Se o documento mostrar o conteúdo desejado, osusuários poderão clicar em um botão Restaurar para copiar o conteúdo emum documento de e-mail em suas caixas de correio.

    Procurar (Microsoft SharePoint e sistemas de arquivos)Os usuários podem visualizar documentos do Microsoft SharePoint emstub e documentos do sistema de arquivos que foram arquivados usando oFile System Connector clicando nos links de stub. Eles podem procurardocumentos do Microsoft SharePoint e documentos do sistema de arquivosusando as ferramentas de procura fornecidas para seus servidores derepositório.

    Para procurar documentos em um repositório do sistema de arquivos, osusuários podem aplicar as ferramentas de procura padrão fornecidas peloWindows.

    Ciclo de Vida do Documento

    O IBM Content Collector possibilita implementar um intervalo deestratégias de retenção de documento, desde a exclusão simples após oprocessamento até uma declaração de documentos formal como registrosno IBM InfoSphere Enterprise Records.

    É possível remover partes dos documentos de e-mail arquivados ou dedocumentos do aplicativo Notes gradativamente do documento originalaté, finalmente, o conteúdo inteiro ser excluído. A remoção de conteúdo dedocumento libera espaço nas caixas de correio ou banco de dados dousuário e nos servidores do seu sistema de gerenciamento de conteúdo.Geralmente, isto aumenta significativamente o rendimento do documento.

    Em sistemas de origem do Microsoft SharePoint, é possível substituirdocumentos inteiros por links para o documento arquivado no repositóriode destino. Posteriormente é possível atualizar links desatualizados eremover links órfãos dos repositórios de destino.

    Para configurar o ciclo de vida do documento de e-mail, você pode definirum ciclo de vida chamado de stub. Fragmentação significa converter umdocumento em um stub. Um stub é um documento a partir do qual aspartes do conteúdo foram removidas. Por exemplo, seu ciclo de vida destub pode instruir o IBM Content Collector a remover anexos do e-mailuma semana após o conteúdo de correio ter sido arquivado. Uma segundainstrução no planejamento do ciclo de vida do apontamento do documentono repositório remove o texto principal ou o corpo do e-mail após quatrosemanas para que apenas um shell vazio do e-mail original permaneça. Porfim, a programação de fragmentação pode ser definida para excluir ocorreio inteiro.

    A função de fragmentação pode inserir links nesses documentos de stubdepois do arquivamento, permitindo que os usuários visualizem oconteúdo arquivado com apenas um clique do mouse. Além disso, o IBM

    Visão Geral do Content Collector 5

  • Content Collector pode ser configurado para inserir textos resumidos noe-mail original para indicar que o conteúdo foi removido, textos queinformam aos usuários sobre o arquivamento de uma parte específica doconteúdo.

    Conceitos relacionados

    “Visão Geral da Arquitetura do Content Collector” na página 15“Cenário: Preparando o Repositório de E-mail para Analíticas de E-mail” na página28“Cenário: Arquivamento de Documentos para Propósitos de Armazenamento” napágina 25“Cenário: Arquivando E-mail de Diário” na página 26“Cenário: Retenção e Disposição de Documento” na página 27Informações relacionadas

    Web site do IBM Content Collector

    O que Há de Novo noContent Collector Versão 2.1.1?O IBM Content Collector Versão 2.1.1 é um upgrade do IBM Content CollectorVersão 2.1.0.

    O IBM Content Collector fornece os seguintes novos recursos.

    Novas Plataformas de Software

    SQL Server 2008

    Lotus Domino 8.5 e Lotus Domino 8.5.1

    FileNet P8 4.5.1

    FileNet RM 4.5

    Content Manager 8.4.2 e Content Manager no Linux® (x86)

    Microsoft SharePointColeta

    Agora você pode coletar e arquivar documentos de sites do Microsoft SharePoint,permitindo atender os objetivos de conformidade e arquivamento ou apenasreduzir a pressão em seus servidores SharePoint.

    Coleta de vários sitesÉ possível coletar de vários sites, subsites e bibliotecas do SharePoint,aplicando diferentes planejamentos e coletando diferentes metadados etipos de conteúdo para cada um.

    Coleta de versõesÉ possível controlar totalmente as mudanças, coletando qualquerquantidade de versões de cada documento.

    Opções de Pós-processamentoQuando o Content Collector copiar documentos para seu repositório, elepoderá reter ou excluir documentos do servidor SharePoint, ousubstituí-los por links para as cópias do repositório.

    6 Guia do Administrador

    http://www.ibm.com/software/data/content-management/content-collector/

  • Extensões para o Email Connector

    Pastas Públicas do Microsoft Exchange 2003/2007Agora é possível capturar e arquivar documentos armazenados nas PastasPúblicas do Microsoft Exchange.

    Aplicativos do Lotus DominoAlém do e-mail, agora é possível capturar e arquivar documentos dosaplicativos Lotus Domino, por exemplo salas de equipe, bibliotecas deprojetos, catálogos de endereços e calendários.

    Aprimoramentos do Gerenciamento de E-mail

    Integração do Records ManagerAgora é possível declarar documentos coletados como registros no IBMInfoSphere Enterprise Records (antigamente IBM FileNet RecordsManager).

    Suporte à pasta gerenciada do Microsoft ExchangeAgora é possível aplicar processamento especial para mensagens em pastasgerenciadas pelo Microsoft Exchange.

    Expiration ManagerO Expiration Manager verifica um repositório em busca de e-mail que sejamais antigo que a data de retenção. Os documentos de e-mail podem serlistados, contados ou excluídos.

    Coleta de informações de arquivamento adicionaisÉ possível ativar o IBM Content Collector para coletar informações dearquivamento adicionais para e-mail que são arquivados manualmente.

    Aprimoramentos do espaço de armazenamentoA introdução do modelo de dados compostos de e-mail melhora muito adeduplicação do anexo separando as informações de corpo de e-mail e demetadados dos anexos integrados.

    Suporte para forms-based authentication (FBA) no Outlook WebAccess

    Para o Microsoft Exchange 2007, o forms-based authentication agora é suportadopara autenticar o Serviço Outlook Web Access no servidor Exchange.

    Acesso Somente Leitura ao Gerenciador de Configuração

    É possível configurar o controle de acesso para o Gerenciador de Configuração. OGerenciador de Configuração pode ser executado no modo integral ou no modosomente leitura, dependendo das permissões do usuário.

    Nova Indexação de Procura de Texto Completa para ContentManager

    O Indexador do IBM Content Collector para Procura de Texto substitui e combinaa saída de usuário de procura de texto e módulos do indexador rápido usadospara Content Manager no Content Collector versões anteriores à V2.1.1 paraformar um componente que é instalado e usado em uma etapa. Ele executaprocessos de recuperação de documento e de conversão de conteúdo em paralelo.

    Visão Geral do Content Collector 7

  • O que Há de Novo no Content Collector Versão 2.2?O IBM Content Collector Versão 2.2 fornece os seguintes novos recursos.

    Novas Plataformas de Software

    Microsoft Exchange Server 2010

    Microsoft Outlook 2010

    Microsoft SharePoint 2010

    Gerenciador de Configuração

    UI atualizada para o Gerenciador de ConfiguraçãoO Gerenciador de Configuração foi reprojetado para torná-lo mais fácil emais intuitivo de usar.

    Salvar rotas de tarefas incompletasAgora é possível salvar rotas de tarefas que estão incompletas ou que nãoforam configuradas completamente.

    Exibição tabulada de rotas de tarefasNa visualização Rotas de Tarefas do Gerenciador de Configuração, agora épossível abrir e trabalhar com mais de uma rota de tarefa por vez.

    Copiar e colar rota de tarefa incluindo rota de tarefa de erroÉ possível copiar uma rota de tarefa existente e sua rota de tarefa de erro eusá-la como uma base para configurar outra rota de tarefa.

    Tornar a rota de tarefa ativa ou inativaComo parte da descrição da rota de tarefa geral, é possível selecionar ter arota de tarefa ativa ou inativa.

    Validação automática de metadados usados em uma tarefaOs metadados produzidos em uma tarefa são automaticamente validados.Se os metadados estiverem ausentes, isso é relatado sob as propriedades datarefa.

    Processamento de Rota de Tarefa

    Configuração flexível de logs de auditoriaAgora é possível incluir tarefas do log de auditoria em qualquer lugar narota de tarefa. O log de auditoria da rota de tarefa de erro agora éindependente do log de auditoria da rota de tarefa principal. Todos os logsde auditoria podem ser configurados de maneira independente e registrardiferentes informações.

    Arquivamento de entradas de calendárioNos modelos de rota de tarefa de arquivamento de e-mail, as entradas decalendário agora estão excluídas do processamento. No lugar, novosmodelos de rota de tarefa estão disponíveis, os quais lidam especificamentecom entradas de calendário.

    Resiliência aprimoradaO serviço principal do IBM Content Collector, o Serviço do IBM ContentCollector Task Routing Engine reinicia automaticamente quaisquer serviçosque ele percebe que foram interrompidos. O número de vezes que oServiço do IBM Content Collector Task Routing Engine tenta reiniciarserviços é configurável.

    8 Guia do Administrador

  • Metadata

    Metadados definidos pelo usuárioAgora é possível importar e exportar propriedades de metadados definidaspelo usuário.

    Propriedades MAPI e Propriedades NomeadasPara o Microsoft Exchange, agora é possível acessar propriedades MAPIadicionais e propriedades nomeadas e usá-las como metadados emprocessamento adicional.

    Monitoramento

    Painel do SistemaO IBM Content Collector agora fornece um painel do sistema o qualpermite monitorar o desempenho do sistema em um ambiente de scale-out.

    IBM Content Manager

    Suporte a Múltiplos RepositóriosO IBM Content Collector agora pode arquivar ou recuperar documentosem mais de um repositório em paralelo.

    Tipos de Itens do DocumentoOs documentos do Sistema de Arquivos ou do Microsoft SharePoint agoratambém podem ser armazenados em um tipo de item do documento doIBM Content Manager.

    Acesso restrito a privilégio de ACLUma opção Lista de Controle de Acesso (ACL) restringe o acesso aoconteúdo para uma lista de usuários específica.

    Verificar se um Documento ExisteHá uma nova tarefa no IBM Content Collector que verifica se umdocumento existe no repositório.

    IBM FileNet P8

    Detecção de Classe de Documento DinâmicaO IBM Content Collector agora pode determinar dinamicamente a classede documento para documentos que devem ser arquivados.

    Verificar se um Documento ExisteHá uma nova tarefa no IBM Content Collector que verifica se umdocumento existe no repositório.

    Configurações de SegurançaAgora é possível escolher que o Content Collector colete automaticamenteinformações de segurança sobre documentos no sistema de origem e queeles sejam mapeados para direitos de acesso do P8 no documento dedestino. Alternativamente, é possível configurar manualmente asconfigurações de segurança.

    Suporte a Múltiplos RepositóriosO IBM Content Collector agora pode arquivar ou recuperar documentosem mais de um repositório em paralelo.

    Mecanismo de recuperação de modelo de dados de e-mailO IBM FileNet P8 Connector possui uma recuperação suavizadora quandose usa o modelo de dados de e-mail e eventos inesperados ocorrem norepositório, como indisponibilidade de servidor e interrupções de rede.Nessas situações, as tarefas do FileNet P8 são normalmente incapazes de

    Visão Geral do Content Collector 9

  • executar qualquer retrocesso ou limpeza. Agora o conector é capaz derecuperar dados automaticamente e finalizar o processamento de e-mailque foi deixado no repositório em um estado inesperado e que atingiuuma idade crítica. Quando um estado de modelo de dados inesperado élocalizado, você é alertado nos logs sobre quais e-mails precisaram serreparados, permitindo escolher se você precisa inspecionar manualmenteos resultados do processo de reparo.

    Sistema de Arquivos

    Suporte do Sistema de Arquivos DFSEsse suporte ativa a coleta de documentos armazenados em umcompartilhamento de sistema de arquivos distribuídos (DSF).

    Suporte do Sistema de Arquivos NovellEsse suporte ativa a coleta de documentos armazenados em um servidorde arquivos na Rede Local.

    Filtragem AvançadaAgora é possível especificar as opções de filtragem avançada para coletardocumentos do sistema de arquivos. As opções incluem filtragem porvários valores de data, filtragem por tamanhos de arquivo e filtragem poratributos de arquivo.

    Mantenha o ícone do arquivo original para atalhos de arquivo após oarquivamento

    Se você arquivar em IBM FileNet P8 a partir de um sistema de arquivos eefetuar stub no documento, o ícone do documento é mantido como eleestava no local original. Em versões anteriores do Content Collector, oícone do atalho do arquivo era exibido.

    Espelhar a Estrutura de Pasta do Arquivo de Origem no Repositório do Sistemade Arquivos

    Agora é possível espelhar a estrutura de pasta do arquivo de origemquando você arquiva arquivos em um repositório do sistema de arquivos.

    Microsoft SharePoint

    Blogs Agora é possível capturar e arquivar blogs e comentários de blogs.

    Captura de Página do WikiAplicativos que abrem página de wiki capturadas em repositórios dedestino agora podem renderizar o conteúdo do wiki mais precisamente.

    Opções de Pós-processamentoA nova opção Marcar como processsado possibilita arquivar documentos semalterar os originais no SharePoint.

    A retenção de versão mais robusta possibilita reter somente a versão maisrecente de um documento, economizando espaço no seu servidor doSharePoint.

    Instalação e Configuração SimplificadasInstalação e configuração dos componentes do Content Collector em seusservidores e farms SharePoint é muito mais fácil, incluindo a eliminação detodos os outros pré-requisitos de software e todas as etapas deconfiguração extras que versões anteriores do Content Collectornecessitavam.

    10 Guia do Administrador

  • Gerenciamento de LinkNovas tarefas de gerenciamento de link e rotas de tarefa possibilitamatualizar links desatualizados e remover links órfãos do SharePoint pararepositórios de destino.

    Colunas da ListaAgora você pode mapear colunas da lista (biblioteca) para metadados.

    Capacidade de Procura Aprimorada nos Repositórios de DestinoO espelho de metadados e configurações de segurança melhora acapacidade de procurar documentos arquivados nos repositórios dedestino.

    Recuperação transparente melhorada a partir do FileNet P8Agora o Serviço da Web Content Collector trata da recuperação dedocumentos em stub a partir do IBM FileNet P8, simplificando a instalaçãodo componente SharePoint, eliminando a necessidade de usuáriosautorizados se autenticarem em repositórios de destino, e padronizando otratamento de stubs do IBM Content Manager para SharePoint e todos osstubs do sistema de arquivos.

    Novos Modelos de Rota de TarefaNovos modelos de rota de tarefa permitem que você colete estatísticas,examine e gerencie links, classifique documentos usando o IBM InfoSphereClassification Module, calcule datas de expiração e declare documentoscomo registros no IBM InfoSphere Enterprise Records

    Novo Conector de Origem

    Conector SMTPAgora é possível capturar e arquivar documentos a partir de sistemas dee-mail do SMTP. O arquivamento de SMTP pode ser usado para objetivosde conformidade.

    Extensões para o Email Connector

    Lotus Domino: Coletar arquivos NSF locaisO administrador pode solicitar aos usuários em um e-mail que façam oupload de seus arquivos NSF locais para um diretório compartilhado.Quando um usuário recebe o e-mail, ele pode clicar em um botão eselecionar o arquivo NSF que é copiado para o servidor no qual ele écapturado e arquivado.

    Aprimoramentos do Gerenciamento de E-mail

    Restaurar Temporariamente o Conteúdo Arquivado quando um Documento deStub é Aberto

    O conteúdo de um documento em stub é recuperado temporariamente apartir do repositório e exibido quando o usuário abre o documento. Osusuários podem encaminhar o conteúdo integral de um documentoarquivado em vez de somente o documento stub. O documento não érestaurado permanentemente, mas fica apenas disponível temporariamente.

    Coleta de informações de arquivamento adicionaisPara o IBM Content Collector Outlook Extension, a janela para coletarinformações de arquivamento adicionais agora também é acionada quandovocê copia ou move e-mail para uma pasta que é configurada de acordo.

    Visão Geral do Content Collector 11

  • Especificar Informações de Arquivamento Adicionais em um Nível de PastaAgora é possível especificar informações de arquivamento adicionais paraqualquer pasta.

    Lista de bloqueioSe um documento não puder ser processado porque ele causa erros emqualquer uma das tarefas do Conector de E-mail ou Conector SMTP emuma rota de tarefas ou mesmo causa a parada completa do processamento,o documento é incluído na lista de bloqueio para evitar que oIBM ContentCollector reprocesse esse documento.

    Expiration Manager

    Gerenciando a Retenção de Documentos a partir do Microsoft SharePoint e doSistema de Arquivos

    O Expiration Manager agora também verifica um repositório em busca dedocumentos do Microsoft SharePoint e do sistema de arquivos que sãomais antigos que a data de retenção. Os documentos agora podem serlistados, contados ou excluídos.

    Clientes do IBM Content Collector

    Lotus Domino iNotes (previamente Domino Web Access (DWA))

    v Agora suporta o Domino V8.5.1 ou acimav Documentos que são restaurados a partir da lista de resultados da

    procura agora podem ser colocados em stubv Agora é possível suprimir a inclusão de dois links de stub de anexo

    selecionando para incluir o link de anexo apenas no resumo de anexo.

    Outlook Web App (previamente Outlook Web Access (OWA))Agora suporta o Outlook OWA 2010

    Suporte a Múltiplos Idiomas no Lotus DominoÉ possível selecionar agora idiomas para o modelo Domino que você ativepara arquivamento usando o IBM Content Collector.

    Suporte de Procura de Texto do Content Collector para IBMContent Manager

    Execute o processo de indexação em modo contínuoO processo afuIndexer pode ser executado em modo de lote ou em modocontínuo no qual o processo continua até ser parado por um comando deencerramento.

    Suporte funcionando com os tipos de itens IBM CommonStore para o modelo dedocumento BUNDLED e o tipo de arquivamento ENTIRE (BRI)

    Os tipos de itens do CommonStore para o modelo de documentoBUNDLED e o tipo de arquivamento ENTIRE podem ser usados noContent Collector.

    Definir seus Próprios Espaços de TabelaVocê não está mais proibido de usar os espaços de tabela padrão do DB2ao utilizar as ferramentas do indexador.

    Especifique uma porta exclusiva na linha de comandosAo indexar mais de um tipo de item ao mesmo tempo, uma portaexclusiva pode ser definida para cada processo.

    12 Guia do Administrador

  • Ler ID do Usuário e Senha a partir do ArquivoO ID do usuário e a senha necessários para executar cada ferramenta doindexador podem ser lidos a partir de um arquivo.

    Verificações de Memória IntegradasO processo do indexador verifica se o conteúdo dos arquivos XML criadosapós a análise do documento se ajusta ao buffer que é entrada para omecanismo de indexação.

    Novas Opções de ConfiguraçãoNovas opções de configuração estão disponíveis para desativar a conversãode documento e para influenciar a maneira como os documentos sãoprocessados usando uma página de códigos especificada.

    Estatísticas Adicionais para Monitorar o Processo de IndexaçãoO status de processamento de cada item agora pode ser monitorado.

    Procurar Usando o IBM Content Collector

    Procura Ativada em Mais de um RepositórioAgora é possível procurar em mais de um repositório de documentos noIBM FileNet P8 e no IBM Content Manager.

    Visão Geral do Content Collector 13

  • 14 Guia do Administrador

  • Visão Geral da Arquitetura do Content Collector

    O IBM Content Collector consiste em vários componentes, que interagem comcomponentes de seus sistemas de arquivosMicrosoft Exchange, Lotus Domino,NTFS, DFS e Novell, ambientes doMicrosoft SharePoint e servidores de repositório.Consulte o diagrama.

    Sistema de OrigemUm sistema que contém documentos com os quais você deseja trabalharem IBM Content Collector. Este pode ser os sistemas de arquivos MicrosoftExchange, Lotus Domino, e-mail SMTP, NTFS, DFS eNovell ou osambientes do Microsoft SharePoint.

    Conector de origemUm conector de origem fornece uma interface com um sistema de terceiroque contém documentos com os quais deseja trabalhar no IBM ContentCollector. Ele é responsável pela comunicação entre servidores de e-mail,servidores de arquivos ou Microsoft SharePoint e IBM Content Collector.

    Figura 1. Diagrama de Interação Incluindo Componentes do IBM Content Collector, Clientesde E-mail, Servidores de E-mail, Microsoft SharePoint, Sistemas de Arquivos e Servidoresde Repositório

    © Copyright IBM Corp. 2008, 2010 15

  • Os documentos que são roteados para o IBM Content Collector paraarquivamento transmitem essa camada antes que eles sejam processados earmazenados em um repositório.

    Conector de DestinoUm conector de destino fornece uma interface com um sistema de terceiroque serve como o repositório de destino para o IBM Content Collector. Eleé responsável pela comunicação entre um repositório do IBM ContentManager, um repositório do IBM FileNet P8 ou um repositório do Sistemade Arquivos e o IBM Content Collector. Documentos que são roteados doIBM Content Collector para o arquivamento passam por esta camada antesde serem armazenados em um repositório.

    Mecanismo de Roteamento de TarefaUm serviço que monitora a maioria dos serviços do coletor que executa noIBM Content Collector.

    Gerenciador de ConfiguraçãoUma interface gráfica com o usuário para a administração do IBM ContentCollector.

    Servidor de Aplicativos da WebO IBM Content Collector Servidor de Aplicativos da Web. Isto pode ser oServidor de Aplicativos da Web integrado ou um WebSphere ApplicationServer externo.

    Conector do Formulário de MetadadosUm conector para um banco de dados no qual os metadados sãoarmazenados temporariamente.

    Conector de Extração de TextoUma interface para o Filtros Oracle/Stellent Outside In Technology, que éusada para converter dados binários, por exemplo, a partir de anexos doe-mail, em uma representação de texto simples.

    Conector do UtilitárioUm contêiner para essas tarefas que fornecem as funções intrínsecas doIBM Content Collector.

    Banco de dados DerbyUm armazenamento temporário para quaisquer informações dearquivamento adicionais que um usuário especificou ao arquivarmanualmente um documento.

    Suporte de Procura de TextoUm componente do IBM Content Collector que processa documentosarquivados em um repositório do IBM Content Manager para ativar aprocura subsequente nestes documentos. Este componente deve serinstalado no servidor IBM Content Manager. Ele contém a funcionalidadeque converte documentos formatados em uma representação somente textoque é então passada para o mecanismo de indexação chamado Net SearchExtender. Após o conteúdo textual de um documento ter sido indexado,este conteúdo pode ser procurado

    16 Guia do Administrador

  • Conceitos relacionados

    “Definição do Modelo de Dados de Armazenamento”“Visão Geral do Content Collector” na página 3“Cenário: Preparando o Repositório de E-mail para Analíticas de E-mail” na página28“Cenário: Arquivamento de Documentos para Propósitos de Armazenamento” napágina 25“Cenário: Arquivando E-mail de Diário” na página 26“Cenário: Retenção e Disposição de Documento” na página 27Referências relacionadas

    “Pré-requisitos Adicionais e Restrições” na página 36Informações relacionadas

    Web site do IBM Content Collector

    Definição do Modelo de Dados de ArmazenamentoO propósito de definir um modelo de dados de armazenamento de e-mail no IBMContent Collector para substituir o formato Bundled Resource Item (BRI) antigo éativar a deduplicação efetiva no e-mail e nos anexos do e-mail em múltiplasorigens de e-mail. Da mesma forma, quaisquer documentos do MicrosoftSharePoint que são identificados como sendo idênticos são armazenados apenasuma vez no repositório. O mesmo se aplica aos documentos do Sistema deArquivos.

    Os aprimoramentos na deduplicação de e-mail abrangem:v Aprimoramento no hash e no armazenamento de propriedades de e-mail

    variadas. Somente uma cópia de um documento de e-mail é armazenada norepositório independentemente de se a origem do e-mail é diário, enviado ourecebido, exceto quando destinatários Cco estejam incluídos no documento dee-mail. Nesse caso, duas cópias do documento de e-mail são armazenadas, umacópia para o diário e todos os destinatários incluindo destinatários Cco e umacópia para o remetente. Isso porque somente para o remetente a lista dedestinatários Cco é restaurada. Para cada destinatário que inclua os destinatáriosde Cco, o documento de e-mail restaurado não contém uma lista de destinatáriosde Cco.

    v Extração dos anexos do e-mail que vêm de múltiplas origens de e-mail earmazenamento desses anexos apenas uma vez no repositório.Se o mesmo anexo também for inserido como um documento através doMicrosoft SharePoint ou do Sistema de Arquivos, nenhuma deduplicação seráfornecida.

    Restrição: A deduplicação de e-mail ocorre somente se as cópias do documento dee-mail possuírem o mesmo formato. Se, por exemplo, o mesmo documento dee-mail estiver presente no formato SMTP/MIME e em um formato de servidor dee-mail nativo para o Domino ou Exchange, não ocorrerá nenhuma deduplicação.

    Modelo de Dados do IBM Content Manager

    Todos os documentos arquivados usando o IBM Content Collector estãoarmazenados nos tipos de itens no IBM Content Manager. É necessário ter pelomenos um tipo de item do IBM Content Manager para cada sistema de origem quevocê configura no IBM Content Collector. A deduplicação nos documentos de

    Visão Geral da Arquitetura do Content Collector 17

    http://www.ibm.com/software/data/content-management/content-collector/

  • e-mail, do Microsoft SharePoint e do Sistema de Arquivos está disponível apenasdentro de um mesmo tipo de item e não em vários tipos de itens.

    O e-mail é armazenado em um tipo de item de e-mail. O tipo de item de e-mail éum tipo de item de recurso do IBM Content Manager contendo uma ou maisinstâncias de e-mail distintas (DEIs).

    Uma DEI é o item raiz e é o objeto de e-mail binário comum em um destesformatos:v Formato binário do Notes (CSN)v Formato Multipurpose Internet Mail Extensions (MIME)v Formato de documento de correio do Microsoft Exchange (MSG)A raiz contém todos os dados e atributos de e-mail comuns que sãocompartilhados em todas as instâncias do e-mail. Ela contém o hash que é usadopara assegurar que o e-mail seja armazenado apenas uma vez no repositório. ADEI é o item requerido por um aplicativo, por exemplo, em um processo de fluxode trabalho, para gerenciamento de registros ou para propósitos de visualização.

    Uma DEI possui dois componentes-filhos:v O filho da instância de e-mail (EI) que controla as referências de todas as cópias

    do mesmo e-mail arquivado a partir de diferentes caixas de correio ou do diário.Ele contém as propriedades de cada cópia de e-mail que são necessárias pararestaurar cada cópia individual do e-mail, as propriedades variadas. Paraarquivamento de diário, as propriedades variadas contêm os atributos de diárioadicionais produzidos durante o processo de diário.

    v O filho da instância de anexo (AI) que controla as referências para os anexos dee-mail que são arquivados separadamente. Como um e-mail pode ter múltiplosanexos, este filho de referência pode ter nenhuma, uma ou várias entradasapontando para os anexos. Não apenas as referências aos anexos sãoarmazenadas, mas também metadados adicionais necessários para visualizar erestaurar o e-mail com seus anexos, por exemplo, o nome do arquivo do anexo euma chave de correlação que é usada para restaurar o anexo para o localoriginal no e-mail.

    18 Guia do Administrador

  • A deduplicação é fornecida pelo Content Collector.

    Quando uma DEI for removida, todos os objetos associados serão removidostambém. Para evitar a exclusão acidental da DEI, por exemplo, por um usuário docliente, a data de expiração é monitorada e, apenas se a data atual passar a data deexpiração, a remoção é permitida.

    Os anexos do e-mail são armazenados em um tipo de item de anexo. O tipo deitem de anexo é um tipo de item de recurso e pode conter anexos de diferentestipos de itens do sistema de origem de e-mail. O tipo de item de anexo contémuma ou mais instâncias de anexo distintas (DAIs). Uma DAI representa o objeto deanexo em si e é o objeto principal que controla a exclusão do conteúdo e dosobjetos associados. Uma DAI é referenciada por uma ou mais AIs a partir de umainstância de e-mail (uma DEI). Uma DAI pode ser removida apenas se nenhumaoutra instância estiver apontando para ela. O único atributo requerido por umaDAI é o hash usado para calcular uma chave de hash de deduplicação exclusivaque assegura que apenas uma cópia do anexo seja mantida em um tipo de item,independentemente de quantas vezes o mesmo anexo foi arquivado por diferentesusuários.

    Não há modelo de dados formal para documentos do Microsoft SharePoint e doSistema de Arquivos. O IBM Content Collector oferece um tipo de item de recursode amostra para cada. É possível escolher não usar as amostras de jeito nenhum ouescolher usar algumas das propriedades das amostras em um tipo de itemcustomizado, dependendo de seu caso de negócio.

    É possível armazenar documentos do Microsoft SharePoint no tipo de item doMicrosoft SharePoint de amostra, que pode ser um dos seguintes tipos de itensIBM Content Manager:v Um tipo de item de recurso com um ou mais itens do Microsoft SharePointv Um tipo de item de documento com uma parte do documento de base

    (ICMBASE) com um ou mais itens do Microsoft SharePoint. Partes dodocumento adicionais podem ser associadas ao tipo de item do documento, maselas são ignoradas por aplicativos ou clientes do IBM Content Managercustomizados.

    Cada item possui uma instância (SI) que controla todas as referências arquivadas apartir do Microsoft SharePoint.

    Visão Geral da Arquitetura do Content Collector 19

  • Sistema de Arquivos são armazenadas em um tipo de item do Sistema deArquivos. O tipo de item do Sistema de Arquivos pode ser um dos seguintes tiposde itens do IBM Content Manager:v Um tipo de item de recurso com um ou mais itens do Sistema de Arquivosv Um tipo de item de documento com uma parte do documento de base

    (ICMBASE) com um ou mais itens do Sistema de Arquivos. Partes dodocumento adicionais podem ser associadas ao tipo de item do documento, masaplicativos customizados e clientes IBM Content Manager as ignoram.

    Cada item possui uma instância (FI) que é usada para controlar todas asreferências arquivadas a partir do Sistema de Arquivos, enquanto apenas um cópiado documento real é armazenada no repositório se a deduplicação foi configuradamanualmente para o tipo de item na rota de tarefa de arquivamento e o tipo deitem está configurado de acordo. Caso contrário, a deduplicação é feita na camadado dispositivo de armazenamento e através do IBM Tivoli Storage Manager (TSM).

    As instâncias de origem podem ser excluídas a qualquer momento, a menos queelas também estejam sob o controle de outro aplicativo, tal como um aplicativo degerenciamento de registros ou o eDiscovery Manager, ou antes de suas datas deexpiração serem atingidas.

    Modelo de Dados do FileNet P8

    Todos os documentos arquivados usando IBM Content Collector são armazenadoscomo objetos do documento do FileNet P8 em um armazenamento de objeto. Oarmazenamento de objeto deve ser dedicado ao arquivamento usando o IBMContent Collector. O mesmo armazenamento de objeto pode ser usado paraarmazenar documentos de e-mail, do Microsoft SharePoint, e do Sistema deArquivos.

    20 Guia do Administrador

  • Um e-mail é armazenado como um objeto do documento e possui os seguintescomponentes:v Uma instância de e-mail distinta (DEI) que é o objeto do documento raiz para o

    e-mail que consiste em um ou mais elementos de conteúdo:– O primeiro elemento de conteúdo é o e-mail de diferentes caixas de correio

    ou do diário.– Todos os elementos de conteúdo subsequentes são os anexos.

    A DEI contém o hash que é usado para assegurar que o e-mail seja armazenadoapenas uma vez no repositório.

    v Um Texto de Instância XML (XIT) que é um arquivo XML indexável contendo adata dos elementos de conteúdo da DEI que precisa ser indexada para procurade texto.

    v Uma instância de e-mail (EI) que é um objeto customizado e controla os dadosexclusivos de todas as cópias de um e-mail (instâncias de caixa de correio ou dediário da DEI).

    A deduplicação de e-mails é fornecida pelo Content Collector, enquanto que adeduplicação de anexos é gerenciada pelo FileNet P8 Versão 4.5.1 ou na camada dodispositivo de armazenamento.

    Quando uma DEI for removida, todos os objetos associados serão removidostambém. Para evitar exclusão acidental da DEI, por exemplo, por um usuário doWorkplace, a data de expiração é monitorada e, apenas se a data atual passar adata de expiração, a remoção é permitida.

    O XIT também é excluído automaticamente quando a DEI é excluída, a menos queum sinalizador de suspensão esteja configurado nele pelo eDiscovery Manager.Neste caso, a DEI não pode ser excluída. Entretanto, se você tentar excluir o XITdiretamente, será produzido um erro e a exclusão não será concluída. Isto asseguraque o XIT não seja excluído acidentalmente e que a indexação seja perdida.

    Visão Geral da Arquitetura do Content Collector 21

  • Não há modelo de dados formal para documentos do Microsoft SharePoint e doSistema de Arquivos. O IBM Content Collector oferece uma classe de documentoda instância de amostra para cada um com os componentes a seguir. É possívelescolher não usar as amostras de jeito nenhum ou escolher usar algumas daspropriedades das amostras em uma classe de documento customizada,dependendo de seu caso de negócio:v Para Microsoft SharePoint:

    – Uma instância do Microsoft SharePoint (SI) que é o objeto do documento raizpara o documento do Microsoft SharePoint com um elemento de conteúdoque é o documento em si. Esta classe de documento da instância do MicrosoftSharePoint contém prováveis propriedades que existem para arquivamento apartir desta origem.

    v Para Sistema de Arquivos:– Uma instância do Sistema de Arquivos (FI) que é o objeto do documento raiz

    para o documento do Sistema de Arquivos com um elemento de conteúdoque é o documento em si. Esta classe de documento da instância contémprováveis propriedades que existem para arquivamento a partir de umsistema de arquivos.

    As instâncias de origem podem ser excluídas a qualquer momento, a menos queelas também estejam sob o controle de outro aplicativo, tal como um aplicativo degerenciamento de registros ou um eDiscovery Manager.

    Para deduplicação do conteúdo do Microsoft SharePoint ou do Sistema deArquivos, o sistema usa a deduplicação nativa que é fornecida pelo FileNet P8Versão 4.5.1 e a deduplicação no nível do dispositivo. Para versões anteriores doFileNet P8, a deduplicação também é gerenciada pelo FileNet P8, a menos que adeduplicação tenha sido configurada manualmente na rota de tarefa dearquivamento.

    Se a deduplicação for gerenciada pelo FileNet P8, um novo objeto do documentoserá criado no FileNet P8 para cada instância de um documento. Como resultado,

    22 Guia do Administrador

  • ao navegar ou procurar, cada duplicata parecerá ser um documento exclusivo,ainda que no nível do armazenamento, apenas uma cópia do arquivo estejaarmazenada. Se a deduplicação for configurada manualmente em uma tarefa dearquivamento, um novo objeto do documento não será criado no FileNet P8. Umobjeto do documento único representa todas as instâncias de um documento.Conceitos relacionados

    “Visão Geral da Arquitetura do Content Collector” na página 15Referências relacionadas

    “Objetos Implementados no FileNet P8” na página 84

    Visão Geral da Arquitetura do Content Collector 23

  • 24 Guia do Administrador

  • Cenários de Arquivamento de Documentos

    O arquivamento de documentos se refere ao armazenamento de longo prazo dee-mail e outros documentos em um repositório central e, em um sentido maisamplo, à capacidade de localizar, visualizar e restaurar conteúdo arquivado. Oscenários de arquivamento de documentos descrevem como o IBM ContentCollector ajuda as empresas a tratarem problemas, tais como, problemas dearmazenamento, de conformidade regulamentar e conformidade de políticainterna. Um cenário focaliza a preparação de um repositório que deve ser usadocomo uma base de conhecimento para analítica com ferramentas, como o IBMeDiscovery Manager e o IBM eDiscovery Analyzer.

    Cenário: Arquivamento de Documentos para Propósitos deArmazenamento

    Esse cenário descreve como os funcionários na ExampleCo. Enterprises, umaempresa fictícia, endereçam os problemas de desempenho e armazenamento dedocumento em estações de trabalho e e-mail do cliente, no Microsoft SharePoint, eem servidores de arquivo NTFS.

    A ExampleCo. Enterprises decide implementar novos processos para arquivardocumentos porque o desempenho dos servidores da empresa se degradouconsideravelmente. O volume de e-mail e de documentos do SharePoint quasedobrou nos últimos dois anos. O e-mail geralmente contém anexos de mais de 2MB de tamanho, portanto, as caixas de correio da maioria dos usuários crescemrapidamente. Os servidores SharePoint podem ser facilmente preenchidos comgráficos ou arquivos de vídeo. Os usuários, às vezes, aguardam vários minutosquando eles procuram e-mail em suas próprias caixas de correio ou documentosno servidor SharePoint. Os documentos ocupam uma grande quantidade de espaçoem disco nas estações de trabalho dos usuários e, o mais importante, nosservidores.

    Aumentar o espaço em disco do servidor não melhorará e poderá reduzir odesempenho do servidor. Assim, a ExampleCo. Enterprises decide usar o IBMContent Collector para arquivar documento em um repositório central. Após copiare-mail e documentos em um repositório central, as partes originais dosdocumentos de e-mail podem ser removidas do sistema de correio. Este método dearmazenar documentos reduz significativamente os requisitos de espaço em disco.Menos dados precisam ser lidos, varridos e manipulados e o desempenho dossistemas de origem melhora.

    Os gerentes discutem os requisitos de arquivamento com Judy Jameson, umaadministradora de TI da ExampleCo. Enterprises. Judy implementa as seguintesregras e processos:v Arquivar automaticamente o e-mail com anexos que são maiores do que 2 MB

    uma semana após suas criações ou seus recebimentos e todos os outrosdocumentos após quatro semanas.

    v Reter documentos neste servidor de origem por três meses, para evitar atraso notrabalho de usuários que estão trabalhando off-line.

    v Após três meses, remover os documentos do SharePoint e anexos do e-mailgrandes e substituí-los por links chamados stubs. Os usuários podem seguir oslinks nos stubs para visualizar e restaurar os documentos.

    © Copyright IBM Corp. 2008, 2010 25

  • v Após um ano, remova os stubs dos servidores de origem. Os usuários comacesso ao repositório de destino podem procurar e restaurar os documentos.

    v Os usuários de e-mail podem arquivar manualmente documentos a qualquermomento.

    Para atender a estes requisitos, Judy decide usar e modificar um ou mais dosmodelos de rota de tarefa entregues pelo IBM Content Collector. Os modelosoferecem uma forma fácil de definir o sistema e não requerem habilidadesprofundas do sistema. Ela pode adaptar os modelos para acomodar futurasnecessidades, mas no presente ela precisa fazer somente ajustes menores paratornar os modelos adequados aos requisitos de gerenciamento de documento daExampleCo. Enterprises.Conceitos relacionados

    “Coletando Documentos para Processamento” na página 494“Visão Geral do Content Collector” na página 3“Visão Geral da Arquitetura do Content Collector” na página 15Tarefas relacionadas

    “Criando uma Rota de Tarefa” na página 297

    Cenário: Arquivando E-mail de DiárioEsse cenário descreve como a ExampleCo. Enterprises, uma empresa fictícia,emprega o IBM Content Collector para arquivar e-mail que é lançado em diáriopela infraestrutura de e-mail da empresa.

    Para propósitos de conformidade e para evitar exclusão acidental ou intencional dee-mail a ExampleCo. Enterprises mantém um diário de todos os e-mails recebidose de saída. Atualmente, todo e-mail é automaticamente lançado no diário para umacaixa de correio de diário em cada um dos servidores de e-mail da empresa. Comoé muito mais fácil para o departamento de conformidade da ExampleCo.Enterprises manter um único diário em vez de diários distintos que estãolocalizados em diversos servidores de e-mail em diferentes locais, a ExampleCo.Enterprises decide usar oIBM Content Collector para criar um archive das cópiasde diário de todos os e-mails de todos os servidores de e-mail para que nãoprecisem ser retidos localmente.

    Os gerentes pedem à Judy Jameson, a administradora de TI, para investigar asopções para arquivar e-mail de diário. Ela identifica duas possíveis estratégias:v Configurar o Content Collector para arquivar diretamente as caixas de correio de

    diário existentes.v Configurar os servidores de e-mail para enviar cópias do diário de todos os

    e-mails para o servidor Content Collector, para que o Content Collector possaarquivá-los.

    Como a empresa já usa caixas de correio de diário, a primeira opção é seguir paraa implementação. Porém, oContent Collector deve efetuar crawl nas caixas decorreio de diário em cada servidor de correio para processar o e-mail de diário.Como os servidores de e-mail são descentralizados em diferentes locais, elesdevem ser acessados em uma rede de longa distância (WAN) em vez de uma redelocal (LAN). Isso não é aconselhável e pode ser muito lento. Para evitar prejudicaro desempenho, Judy decide implementar a segunda opção e configurar osservidores de e-mail para enviar cópias do diário de todos os futuros e-mails parao servidor Content Collector. O Content Collector então coleta todos os e-mails dediário que ele recebe de diferentes servidores e armazena-os no mesmo archive.

    26 Guia do Administrador

  • Para receber e processar o e-mail de diário noContent Collector, Judy configura oConector SMTP, que recebe e-mail por meio do Protocolo Simples de Transferênciade Correio, e configura uma rota de tarefa para arquivar o e-mail recebido. Depois,ela modifica a configuração do diário de cada servidor de e-mail da empresa parafornecer o correio do diário para o servidor Content Collector por meio de conexãoSMTP em vez de armazená-lo em uma caixa de correio de diário.Conceitos relacionados

    “Visão Geral do Content Collector” na página 3“Visão Geral da Arquitetura do Content Collector” na página 15Tarefas relacionadas

    “Criando uma Rota de Tarefa” na página 297“Configurando o Conector SMTP” na página 204“Coletando Documentos SMTP” na página 518

    Cenário: Retenção e Disposição de DocumentoEsse cenário descreve como a empresa imobiliária ExampleCo. Enterprises usa oIBM Content Collector para reter e dispor documentos eletrônicos.

    Para evitar a exclusão acidental ou intencional de documentos, a empresaatualmente registra seu e-mail e faz backup de cada documento de seu MicrosoftSharePoint e de seus servidores de arquivos. O método funciona, mas não muitobem, porque requer disposição manual de documentos e, certamente, sobrecarregaos servidores de origem, reduzindo o desempenho e consumindo cada vez maisespaço em disco. A recuperação de documentos de backup é trabalhosa ou atéimpossível.

    Antes que possam implementar uma solução melhor, a ExampleCo. Enterprisesdeve determinar o nível de controle que precisam sobre os ciclos de vida deretenção e os resultados. Seu administrador de registros, Alexandra Jackson,informa ao coordenador que eles precisam declarar um subconjunto significativode documentos como registros. A maioria de seus documentos eletrônico, noentanto, requer apenas retenção simples: mantê-los por três anos, em seguida,excluir.

    A empresa decide usar o IBM Content Collector para reter seus e-mails e outrosdocumentos. O aplicativo oferece dois níveis de retenção:v A tarefa Calcular Data de Expiração planeja documentos arquivados para exclusão

    a partir do repositório após um número especificado de dias que podem variarpor metadados tal como usuário, grupo ou uma classificação automática que oIBM InfoSphere Classification Module fornece.

    v A tarefa Declarar Registro trata de tarefas de retenção mais complexas, tal como oaplicativo de períodos de retenção variáveis e opções de disposição para o IBMInfoSphere Enterprise Records.

    Como a empresa requer a retenção básica de alguns documentos e a declaração deoutros documentos como registros, ela decide usar ambas as opções.

    Alexandra pede a Judy Jameson, o administrador de TI, para configurar o IBMContent Collector para declarar como registros todos os documentos que precisamser registros e para arquivar e então excluir todos os outros documentos após trêsanos. Judy usa os modelos de rota de tarefa para criar dois conjuntos de rotas detarefas, um conjunto para processar os documentos que precisam ser registros eoutro para processar todos os outros documentos. Para cada rota de tarefa no

    Cenários de Arquivamento de Documentos 27

  • primeiro conjunto ela inclui uma tarefa Declarar Registro que declara cadadocumento como um registro em IBM InfoSphere Enterprise Records. Para cadarota de tarefa no outro conjunto ela inclui a tarefa Calcular Data de Expiração e aconfigura para marcar documentos como elegíveis para exclusão após três anos.Ela, então, planeja o Expiration Manager para excluir documentos elegíveis todasemana.Conceitos relacionados

    “Coletando Documentos para Processamento” na página 494“Visão Geral do Content Collector” na página 3“Visão Geral da Arquitetura do Content Collector” na página 15Tarefas relacionadas

    “Criando uma Rota de Tarefa” na página 297

    Cenário: Preparando o Repositório de E-mail para Analíticas de E-mailA ExampleCo. Enterprises, uma empresa fictícia que constrói dispositivoseletrônicos, deve ir à justiça contestar reclamações de patente por outras empresas.O e-mail, entre outras evidências, pode comprovar que a ExampleCo. Enterprises éa proprietária legal de suas invenções. Esse cenário descreve como os funcionáriosna ExampleCo. Enterprises preparam seu sistema de arquivamento de e-mail parapoder localizar o e-mail relevante ao processo judicial.

    Às vezes, os concorrentes copiam as invenções da ExampleCo. Enterprisesilegalmente. Quando a ExampleCo. Enterprises sabe de um caso assim, elaconsidera um processo judicial contra a parte infratora ou demanda compensação.A empresa precisa provar ser a proprietária legal dessas inovações. Para fazer isso,a ExampleCo. Enterprises fornece a um escritório de advocacia projetos, minutosde reuniões, especificações do produto, patentes, aplicativos da patente, e e-mailque datam da época em que um produto foi desenvolvido. O escritório deadvocacia analisa o material e, com base nos resultados, tenta negociar umaquitação com a parte acusada.

    O e-mail dos engenheiros naExampleCo. Enterprises prova que as ideias surgiramna ExampleCo. Enterprises antes que possivelmente pudessem ter sido discutidaspelo concorrente. De especial interesse é o e-mail de engenheiros que deixaram aExampleCo. Enterprises para trabalhar para a concorrência. Alguns dessesdocumentos contêm sugestões de que uma tecnologia foi desenvolvida quando o

    28 Guia do Administrador

  • engenheiro ainda trabalhava para a ExampleCo. Enterprises e que, portanto, aExampleCo. Enterprises tem o direito exclusivo de usar essa tecnologia. Em casoscomo esse, os antigos gerentes e colaboradores do engenheiro devem seridentificados para que possam testemunhar, se necessário.

    As informações no e-mail podem ajudar os procuradores a rastrearem osdepartamentos para os quais uma pessoa trabalhou e assegurar que eleslocalizaram a pessoa correta. Por essa razão, Chris Marsh, o chefe do departamentode processo judicial da corporação, e Alexandra Jackson, a administradora de casoslegais, querem pesquisar números de departamentos, identificadores exclusivos defuncionários e gerentes de funcionários e departamentos. Para coletar e preservar oe-mail, eles usam uma ferramenta tal como IBM eDiscovery Manager e, paraanalisarem o e-mail, eles usam ferramentas de analíticas de e-mail como IBMeDiscovery Analyzer. Para fornecer os resultados da procura apropriados, estasferramentas requerem que atributos adicionais sejam configurados no repositóriode e-mail. Chris e Alexandra pedem a Judy Jameson, o administrador de TI, paraconfigurar o repositório de e-mail de maneira apropriada.

    Judy cria atributos adicionais no sistema de gerenciamento de conteúdo que estáservindo como o repositório de e-mail. Esses atributos devem conter números dedepartamento, identificadores e nomes de gerentes. O IBM Content Collectorarmazenará as informações para cada e-mail que é arquivado no repositório. Comoas informações não podem ser localizadas no e-mail, elas serão extraídas do ActiveDirectory da empresa quando o e-mail for arquivado. Judy também inclui os novosnomes de atributos no arquivo de configuração para o indexador de pesquisa detexto que é fornecido pelo IBM Content Collector. Isso provoca uma extração dosvalores de atributos quando o índice é construído, que inclui essas informações noíndice de pesquisa de texto. As informações no índice de procura de texto sãousadas pelo IBM eDiscovery Manager.

    Cenários de Arquivamento de Documentos 29

  • 30 Guia do Administrador

  • Parte 2. Instalando

    © Copyright IBM Corp. 2008, 2010 31

  • 32 Guia do Administrador

  • Instalando o Content Collector

    Instale o IBM Content Collector de acordo com seus requisitos. Verifique ospré-requisitos antes de iniciar a instalação.Informações relacionadas

    Requisitos de sistema

    Pré-requisitos para a InstalaçãoLeia as notas sobre o release e verifique os pré-requisitos na web e nos tópicos aseguir antes de instalar o IBM Content Collector.

    Pré-requisitos de HardwareVerifique o hardware necessário para o IBM Content Collector, para os sistemas deorigem que contêm os documentos a serem arquivados e para os repositórios nosquais você deseja arquivar os documentos.

    Para os requisitos de hardware mais atuais, consulte a nota técnica Requisitos doSistema emhttp://www.ibm.com/support/docview.wss?uid=swg27019702.

    Além disso, considere os seguintes requisitos:v Você precisa de um computador ou partição separada que seja executada em um

    dos sistemas operacionais Windows® suportados. Este computador ou máquinalógica deve estar conectado por uma rede TCP/IP aos servidores nos quais seusrepositórios e seus sistemas de origem estão instalados.Para Lotus Domino, este computador requer que um tempo de execução doLotus Domino Server esteja instalado.Para o Microsoft Exchange, este computador deve estar no mesmo domínio queo servidor Microsoft Exchange.

    v O Content Collector usa uma arquitetura de processo múltipla para usardiversos GB da memória principal de maneira eficiente. Além disso, odesempenho é bastante melhorado se existir uma quantidade de memóriadisponível suficiente para o cache do disco do sistema operacional.O requisito mínimo de 4 GB de memória é suficiente para os servidores ContentCollector que são usados para coleta e arquivamento básicos de documento.Porém, mais memória (a quantidade recomendada é 8 GB) é necessária:– Para servidores de produção que destinam-se a cargas de trabalho grandes,

    ou seja, para servidores que processam muitos documentos potencialmentegrandes paralelamente

    – Para servidores Content Collector que também fornecem serviços de procura,visualização e restauração por meio de aplicativos da Web, por exemplo, emcenários de gerenciamento de caixa de correio

    – Para os servidores que executam o componente Receptor SMTP do ConectorSMTP

    Mais de 4 GB podem ser endereçados eficientemente em sistemas que usam umaversão de 64 bits do sistema operacional.

    v O diretório ativo que o conector do servidor de e-mail usa para criar earmazenar arquivos temporários deve estar em um disco separado e rápido.

    © Copyright IBM Corp. 2008, 2010 33

    http://www-01.ibm.com/support/docview.wss?rs=484&uid=swg27016442http://www.ibm.com/support/docview.wss?uid=swg27019702

  • v Use uma matriz Raid 5 para seu sistema operacional e para os componentes doContent Collector. A matriz Raid 5 ajuda a evitar tempo de inatividade dosistema em caso de falhas do disco rígido. Entretanto, não use uma matriz Raid5 para o diretório ativo do conector de servidor de e-mail devido à perda degravação de Raid 5.

    Pré-requisitos de SoftwareAssegure que você tenha o software necessário instalado nos níveis de versão queeste release do IBM Content Collector suporta.

    Verifique os requisitos para o software necessário para o IBM Content Collector,para os sistemas de origem que contêm os documentos a serem arquivados, e paraos repositórios nos quais você deseja arquivar os documentos.

    Para os requisitos de software mais atuais, incluindo versões, consulte a notatécnica Requisitos do Sistema emhttp://www.ibm.com/support/docview.wss?uid=swg27019702.

    Além disso, considere os seguintes requisitos:v Para usar o Lotus Domino como um sistema de origem:

    – Instale o Servidor Lotus Domino no servidor IBM Content Collector edesative o serviço Lotus Domino.

    – Instale o Cliente Lotus Domino em computadores clientes.v Para usar o Microsoft Exchange como um sistema de origem:

    1. Instale o Microsoft Outlook, incluindo os service packs e correções maisrecentes.

    2. Inicie o Microsoft Outlook e verifique sua conexão com o servidor de e-mail:Crie um perfil e, em seguida, efetue logon no Microsoft Exchange com ousuário que é especificado para a conta do usuário para o serviço do IBMContent Collector Email Connector.

    3. Torne o Microsoft Outlook o cliente de e-mail padrão.4. Configure o Microsoft Outlook para solicitar um perfil sempre que o Outlook

    for iniciado.5. Pare o Microsoft Outlook antes de instalar o Content Collector Server.

    v Para usar o Content Manager como seu repositório:– Instale e configure o conector do IBM Information Integrator para Content no

    servidor no qual o Content Collector deve ser instalado.– Se você desejar procurar documentos que são arquivados no IBM Content

    Manager, instale o IBM Content Collector Text Search Support no servidorIBM Content Manager antes de instalar o Content Collector. No SolarisOperating Environment, o componente de procura de texto requer o pacoteiconv.

    v Para usar o IBM FileNet P8 como seu repositório:– Dependendo da versão do FileNet P8 que você está usando, é necessário

    instalar diferentes clientes e software de suporte. Consulte a nota técnicaRequisitos do Sistema.

    – O Servidor FileNet P8 Content Engine deve ser instalado e configurado pararecuperação baseada em conteúdo (CBR). Para obter informações adicionais,consulte a seção sobre como configurar o Content Engine para CBR nadocumentação do FileNet P8.

    34 Guia do Administrador

    http://www.ibm.com/support/docview.wss?uid=swg27019702

  • – FileNet P8 Content Engine .NET deve ser instalado para ativar a comunicaçãoentre o servidor FileNet P8 Content Engine e o IBM Content CollectorConfiguration Manager serviço do IBM Content Collector IBM FileNet P8Connector. Esse instalador é integrado na opção .NET Clients do instaladordo Servidor FileNet P8 Content Engine.

    – Opcional: Instale o IBM FileNet Enterprise Manager na máquina na qual oServidor Content Engine está instalado. Essa é uma sub-opção da opção .NETClients no instalador do Servidor FileNet P8 Content Engine.

    – Instale o componente dos clientes Java do FileNet P8 Content Engine.- Para o FileNet P8 Content Engine 4.0.1 essa é uma opção do instalador do

    FileNet P8 Content Engine.- Para o FileNet P8 Content Engine 4.5.x, é necessário executar o instalador

    do FileNet P8 Content Engine Client. Selecione Outros Aplicativos noinstalador do FileNet P8 Content EngineClient. Isso acionará a instalaçãodas bibliotecas API do FileNet Java Client. Elas são requeridas pelaConfiguração Inicial doContent Collector, Serviços da Web do ContentCollector e as Configurações Gerais doGerenciador de Configuração.FileNet P8 O Content Engine Client e a API do FileNet Java Client devemser instalados antes da instalação do Servidor IBM Content Collector. Se aAPI do FileNet Java Client não for instalada, um ícone de aviso (um pontode exclamação vermelho) será mostrado na configuração inicial e nenhumaconexão do FileNet P8 poderá ser criada.

    – Certifique-se de que a instalação no servidor FileNet P8 Content Enginesempre esteja em sincronia com a instalação no servidor IBM ContentCollector. Note que as bibliotecas Java em CEClient\lib são copiadas para aimplementação dos Serviços da Web do Content Collector durante ainstalação. Se uma atualização do FileNet Java Client for necessária, asversões mais novas desses arquivos devem ser copiadas para AFUWeb\lib.

    – Instale o IBM FileNet Content Search Engine em um servidor diferente doservidor IBM FileNet Content Engine. Observe que não é possível colocar oAutonomy K2 Master Administration Server e um Autonomy K2Administration Server adicional no mesmo servidor. Para obter informaçõesadicionais, consulte a seção sobre como instalar o Content Search Engine nadocumentação do FileNet P8.

    v Dependendo do tipo de banco de dados que você deseja usar para os dados deconfiguração, você deve instalar diferentes clientes e software de apoio:

    banco de dados DB2Instale o DB2 Runtime Client no Content Collector Server paraestabelecer uma conexão.

    banco de dados SQL ServerInstale um driver JDBC.

    banco de dados Oracle

    – Instale um driver JDBC– Instale as ferramentas do Oracle Client

    v O WebSphere Application Server é necessário para fornecer acesso aos dados deconfiguração e aos documentos arquivados. Ele hospeda os aplicativos da Webdo Content Collector. Se não desejar usar o Servidor de Aplicativos da Webintegrado para armazenar os dados de configuração, instale outro WebSphereApplication Server ou use um existente. Os aplicativos da Web doIBM ContentCollector suportam os navegadores da Web Internet Explorer e Mozilla Firefox.

    Instalando o Content Collector 35

  • Pré-requisitos Adicionais e RestriçõesConsidere os pré-requisitos e restrições adicionais listados antes de instalar o IBMContent Collector.

    Considerações para o Sistema de Origem

    Tabela 1. Considerações para o Sistema de Origem

    Sistema de Origem Pré-requisitos e Restrições

    Lotus Domino v Se desejar usar o iNotes (anteriormenteDomino Web Access (DWA)), configure o iNotesno ServidorLotus Domino.Importante: Para Lotus iNotes, um Arquivo de Formulários de Extensão denominadoForms85_x.nsf deve existir no diretório iNotes no servidor Lotus Domino. Se o arquivonão existir, você deverá criar um antes de poder ativar os recursos do ContentCollector no Lotus iNotes. Para obter informações sobre como criar um Arquivo deFormulários de Extensões, consulte o tópico sobre como customizar a aparência doLotus iNotes no IBM Lotus Domino e o centro de informações do Notes emhttp://publib.boulder.ibm.com/infocenter/domhelp/v8r0/index.jsp.

    v Certifique-se de que o servidor Lotus Domino do qual o IBM Content Collector arquivaé reinicializado após toda a ativação para oIBM Content Collector ter sido concluída.

    v Quando você usa o IBM Lotus Domino Attachment and Object Store (DAOS) e desejarestaurar seus documentos de volta para o Lotus Notes, os an