⑴ 文本文件导入到数据库中的几种方法
大型的数据库开发中常常遇到数据源是平面文件(如文本文件)的情况,对于这样的数据源,无法使用数据库对其数据进行有效的管理,另外也无法使用SQL语句对其进行查询和操作,所以当务之急就是将这些平面文件导
入到数据库中,然后就可以对其进行高效的操作了。
下面介绍几种常见的数据导入的方法,希望能够给大家启迪。另外,本文所涉及到的数据库均为ORACLE数据库,其实对于其他数据库而言,方法类似。
一、Sql*:Loader
该方法是Oracle数据库下数据导入的最重要的方法之一,该工具由Oracle客户端提供,
其基本工作原理是:首先要针对数据源文件制作一个控制文件,控制文件是用来解释如何对源文件进行解析,其中需要包含源文件的数据格式、目标数据库的字段等信息,一个典型的控制文件为如下形式:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'
TRUNCATE (也可以用append替换TRUNCATE)
INTO TABLE fj_ipa_agentdetail
fields terminated ","
trailing nullcols
( AGENT_NO char,
AGENT_NAME char,
AGENT_ADDRESS char,
AGENT_LINKNUM char,
AGENT_LINKMAN char
)
其中,INFILE '/ora9i/fengjie/agent/data/ipaagentdetail200410.txt'指明所要导入的源文件,其实源文件也可以直接通过命令行来输入获得 ,fj_ipa_agentdetail为目标表的名字,fields terminated ","是指源文件的各个字段是以逗号分隔,trailing nullcols表示遇到空字段依然写入到数据库表中,最后这5个字段是目标数据库表的字段结构。通过上面这个典型的控制文件的格式分析可知,控制文件需要与源文件的格式信息一致,否则导入数据会出现异常。
除了控制以外,sql*loader的还需要数据文件,即源文件。根据格式的不同,源文件可以分为固定字段长度和有分隔符这两大类,这里将分别说明这两种情况:
固定字段长度的文本文件
就是每个字段拥有固定的字段长度,比如:
602530005922 1012
602538023138 1012
602536920355 1012
602531777166 1012
602533626494 1012
602535700601 1012
有分隔符的文本文件
就是每个字段都有相同的分隔符分隔,比如:
1001,上海长途电信综合开发公司,南京东路34号140室
1002,上海桦奇通讯科技有限公司,武宁路19号1902室
1003,上海邦正科技发展有限公司,南京东路61号903室
对于上述两种文件格式sql*loader均可以做处理,下面就前面那个固定长度的文本来举例说明:
由于该文本只有两个字段,一个为设备号,一个是区局编号,两者的长度分别为20和5,那么可以编制控制文件如下:
LOAD DATA
INFILE '/ora9i/fengjie/agent/data/ipaagent200410.txt'
TRUNCATE
INTO TABLE fj_ipa_agent
( DEVNO POSITION(1:20) CHAR,
BRANCH_NO POSITION(21:25) CHAR
)
其中,'/ora9i/fengjie/agent/data/ipaagent200410.txt'为该文件的完全路径,POSITION(M:N)表示该字段是从位置M到位置N。
对于有分隔符的数据文件,前面已经有一个例子,这里就不再赘述了。总之,使用Sql*Loader能够轻松将数据文件导入到数据库中,这种方法也是最常用的方法。
二、 使用专业的数据抽取工具
目前在数据仓库领域中,数据抽取与装载(ETL)是一重要的技术,这一技术对于一些大的数据文件或者文件数量较多尤其适合。这里简单介绍目前一款主流的数据抽取工具 ――Informatica。
该工具主要采用图形界面进行编程,其主要工作流程是:首先将源数据文件的结构(格式)导入为Informatica里,然后根据业务规则对该结构进行一定的转换(transformation),最终导入到目标表中。
以上过程仅仅只是做了一个从源到目标的映射,数据的实际抽取与装载需要在工作流(workflow)里进行。
使用专业的数据抽取工具,可以结合业务逻辑对多个源数据进行join,union,insect等操作,适合于大型数据库和数据仓库。
三、 使用Access工具导入
可以直接在Access里选择‘打开‘文本文件,这样按照向导来导入一个文本文件到Access数据库中,然后使用编程的方法将其导入到最终的目标数据 库中。
这种方法虽然烦琐,但是其对系统的软件配置要求相对较低,所以也是有一定的使用范围
⑵ 如何将文本中的内容 导入access数据库中
1、首先文本文件应该是以逗号分隔或制表符分隔的文件才可以导入;
2、然后切换到Access;
3、在Access中打开新的或已有的数据库;
9、根据“导入文本向导”对话框中的指导进行操作;
如果,你需要查看更多的选项或修改指导项(比如域分隔符),可单击第一个向导对话框中的“高级”命令。如果要保存指定项,以便下次导入相似的文本文件时可用它们,请单击“另存为”命令。
⑶ 数据库文件是什么格式啊
数据库文件的格式包括CSV、DAT、DBF、MDB、ODB++等等。具体如下:
1、CSV
是逗号分隔值文件格式,其文件以纯文本形式存储表格数据。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串。
2、DAT文件
DAT文件,即数据文件,这类文件并没有进行绝对化的定义。DAT文件的扩展名是.dat。这种文本是纯文本,卖李没有数据属性结构方面的信息,可以用记事本等文本工具打开。
3、DBF
是一种特殊的文件格式,表示数据库文件。Foxbase、Dbase、Visual FoxPro等数据库处理系统所产生的数据库文件。简写为dbf或.dbf。DBF dBASE文件中裂迟,一种由Ashton-Tate创建的格式。
4、MDB
使用mdb格式的数据库是一种关系数据库。MDB View可以在没有安装 Microsoft Access情况下源森进行阅读MDB数据库文件。因其对数据操作的方便性,常用在一些中小型程序。MDB是MDB/ ICP协议的简称,欧洲售货机制造者协会制定用于协调自动售货系统主控制器与多个外设间通信的协议。
5、ODB++
ODB++是一种可扩展的ASCII格式,它可在单个数据库中,保存PCB制造和装配所必需的全部工程数据。是能把多种数据格式数据库连接起来的桥梁,也是一种双向格式,允许数据上行和下传。
⑷ 请问ACCESS中的数据类型
在早期版本的 Access 中,使用“备注”数据类型存储大量文本,使用“文本”数据类型存储较短的字符串。
在 Access 2013 中,这两个数据类型已分别被重命名为“长文本”和“短文本”,它们具有不同的属性和大小限制。 在 .accdb 文件中,长文本字段的作用与旧的“备注”字段相同。
格式文本是指使用纯文本中没有的通用格式选项(例如,加粗和倾斜)设置了格式的文本。Office Access 2007 通过使用“备注”数据类型来存储格式文本。
这是 Access 中唯一具有对格式文本的内置支持的数据类型。若要创建用于存储格式文本的字段,请创建一个备注字段,然后将该字段的 TextFormat 属性设置为 RichText。
(4)文本格式放什么数据库扩展阅读:
特性:
其开发对象主要是Microsoft JET数据库和Microsoft SQLServer数据库。由于在Office 97及以前的版本中,Microsoft JET 3.51及以前版本的数据库引擎是随Access一起安装和发布的,JET数据库与Access就有了天生的血缘关系。
并且Access对JET数据库做了很多地扩充,如,在Access的环境中,可以在查询中使用自己编写的VBA函数,Access的窗体、报表、宏和模块是作为一种特殊数据存储在JET数据库文件(.mdb)中,只有在Access环境中才能使用这些对象。
Microsoft Windows操作系统版本的不断升级和改良,在Windows XP以后版本中,Microsoft将JET数据库引擎集成在Windwos操作系统中作为系统组件的一部分一起发布。从此JET数据库引擎从Access中分离出来,而Access也就成为了一个专门的数据库应用开发工具。