CentOS 7 安装 Greenplum6 (附 dotNET Core 示例)

共 8022字,需浏览 17分钟

 ·

2021-04-14 02:26

Mysql 在面对大数据量的时候,还是表现有些吃力,所以产品中需要扩展能支持海量数据的数据库,这里选择的数据库为 Greenplum6 ,Greenplum 底层使用的是开源数据库 PostgreSQL 。本文会介绍怎样在 CentOS 7 中安装 Greenplum6,并使用 dotNET Core 程序进行连接访问。

环境

  • CentOS:7.6
  • Greenplum:6.15
  • dotNET Core:3.1
  • NpgSql:5.0.4

安装 Greenplum

1、执行命令 vi /etc/selinux/config 修改配置文件来禁用 SELinux ,如下图:

修改配置文件后,需要重启服务器生效。

2、执行命令 vi /etc/sysctl.conf 修改 OS 参数,在配置文件最后累加下面内容:

# kernel.shmall = _PHYS_PAGES / 2 # See Note 1
kernel.shmall = 4000000000
# kernel.shmmax = kernel.shmall * PAGE_SIZE # See Note 1
kernel.shmmax = 500000000
kernel.shmmni = 4096
vm.overcommit_memory = 2
vm.overcommit_ratio = 95 # See Note 2
net.ipv4.ip_local_port_range = 10000 65535 # See Note 3
# kernel.sem = 500 1024000 200 4096
kernel.sysrq = 1
kernel.core_uses_pid = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.msgmni = 2048
net.ipv4.tcp_syncookies = 1
net.ipv4.conf.default.accept_source_route = 0
net.ipv4.tcp_max_syn_backlog = 4096
net.ipv4.conf.all.arp_filter = 1
net.core.netdev_max_backlog = 10000
net.core.rmem_max = 2097152
net.core.wmem_max = 2097152
vm.swappiness = 10
vm.zone_reclaim_mode = 0
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 100
vm.dirty_background_ratio = 0 # See Note 5
vm.dirty_ratio = 0
vm.dirty_background_bytes = 1610612736
vm.dirty_bytes = 4294967296
net.ipv4.ip_forward = 0
net.ipv4.tcp_tw_recycle = 1
kernel.sem = 500 1024000 200 4096

修改配置文件后,执行 sysctl -p 使其生效。

3、执行命令  vi /etc/security/limits.conf 修改配置,内容如下:

* soft nofile 524288
* hard nofile 524288
* soft nproc 131072
* hard nproc 131072

4、执行命令 vi /etc/security/limits.d/20-nproc.conf 修改配置,内容如下:

* soft nofile 524288
* hard nofile 524288
* soft nproc 131072
* hard nproc 131072

修改完成后,重启系统使其生效。执行 ulimit -u 查看每个用户可用的最大进程数,如果返回值为 131072 说明正确。

5、执行下面的命令来设置预读块、I/O调度程序:

/sbin/blockdev --setra 16384 /dev/sda*
echo deadline > /sys/block/sda/queue/scheduler
echo deadline > /sys/block/sr0/queue/scheduler

6、修改配置文件 /etc/systemd/logind.conf ,将 RemoveIPC 设置为 no ,如下图:

修改完后,执行命令 service systemd-logind restart 重启服务。

7、执行下面命令添加用户 gpadmin :

groupadd gpadmin
useradd gpadmin -r -m -g gpadmin
passwd gpadmin # 修改gpadmin账户的密码

8、修改配置文件 /etc/sudoers ,允许 gpadmin 用户无密码使用 sudo 命令,添加内容如下图:

gpadmin ALL=(ALL) NOPASSWD:ALL

9、安装 Greenplum

从 https://github.com/greenplum-db/gpdb/releases 下载对应的 rpm 文件, 如下图:

在目录 /usr/local 目录中创建 greenplum 目录,将下载好的 rpm 文件复制到该目录中。

执行 rpm -ivh /usr/local/greenplum/open-source-greenplum-db-6.15.0-rhel7-x86_64.rpm 进行 Greenplum 6 的安装。执行命令时可能会出现下面的错误提示:

原因是有些依赖项没有被安装,依次执行下面的命令进行依赖项的安装:

yum install -y apr
yum install -y apr-util
yum install -y bzip2
yum install -y krb5-devel
yum install -y libyaml
yum install -y perl
yum install -y rsync
yum install -y zip
yum install -y net-tools
yum install -y ibevent

依赖安装成功后,重新执行 rpm -ivh /usr/local/greenplum/open-source-greenplum-db-6.15.0-rhel7-x86_64.rpm 进行安装。成功安装后执行 chown -R gpadmin:gpadmin /usr/local/greenplum-db* 进行账户 gpadmin 的权限的设置。

10、执行命令 hostnamectl set-hostname gpdb 将主机名修改为 gpdb 。

11、修改 hosts 文件

执行 vi /etc/hosts 进行 hosts 文件的修改,如下图:

11、设置 gpadmin 账户的 ssh 免密登录

首先执行命令 su - gpadmin 切换到 gpadmin 账户

/home/gpadmin 目录中创建文件 all_hosts ,内容为上面修改的主机名 gpdb ,然后执行下面命令:

source /usr/local/greenplum-db/greenplum_path.sh
gpssh-exkeys -f /home/gpadmin/all_hosts

12、执行下面命令使变量生效,在 gpadmin 账户下执行

su - gpadmin
source /usr/local/greenplum-db/greenplum_path.sh 

13、执行命令 vi /home/gpadmin/.bashrc 编辑该文件进行环境变量的配置,下面内容追加在文件最后:

source /usr/local/greenplum-db/greenplum_path.sh
export MASTER_DATA_DIRECTORY=/home/gpadmin/master/gpseg-1
export PGPORT=5432
export PGUSER=gpadmin
export PGDATABASE=postgres

14、执行下面命令进行数据目录的创建:

mkdir -p /home/gpadmin/master
mkdir -p /home/gpadmin/data/gp1
mkdir -p /home/gpadmin/data/gp2
mkdir -p /home/gpadmin/data/gp3
mkdir -p /home/gpadmin/data/gp4

执行命令 chown -R gpadmin:gpadmin /home/gpadmin/* 进行目录的授权。

15、初始化 Greenplum

首先复制配置文件到 /home/gpadmin 目录中:


su - gpadmin # 切换到 gpadmin 账户
mkdir /home/gpadmin/gpconfigs  # 创建配置文件目录
cp $GPHOME/docs/cli_help/gpconfigs/gpinitsystem_config /home/gpadmin/gpconfigs/gpinitsystem_config # 复制配置文件

修改所需参数,执行命令 vi /home/gpadmin/gpconfigs/gpinitsystem_config 修改配置文件,在文件最后追加下面内容:

declare -a DATA_DIRECTORY=(/home/gpadmin/data/gp1 /home/gpadmin/data/gp2 /home/gpadmin/data/gp3 /home/gpadmin/data/gp4)
MASTER_HOSTNAME=gpdb #gpdb 为上面设置的主机名称
MASTER_DIRECTORY=/home/gpadmin/master

执行下面命令进行初始化操作:

gpinitsystem -c /home/gpadmin/gpconfigs/gpinitsystem_config -h all_hosts

执行过程中会出现交互,输入 y 继续即可,正常如下图:

16、设置远程连接配置

执行命令 vi /home/gpadmin/master/gpseg-1/postgresql.conf 修改配置,将 #listen_addresses = '*' 前面的 # 取消,如下图:

执行命令 vi /home/gpadmin/master/gpseg-1/pg_hba.conf 修改配置,在文件最后追加下面内容:

host all gpadmin  0.0.0.0/0  md5

17、修改密码和测试连接,在 gpadmin 账户下执行 

su - gpadmin # 切换到 gpadmin 账户
psql -d postgres # 进入到数据库命令行模式
alter user gpadmin with password '123456'; # 修改gpadmin 账户的密码为 123456

使用 Navicat 进行连接测试:

dotNET Core 示例

1、使用 VS2019 创建控制台项目  GreenplumDemo 。

2、安装 NuGet 包 NpgSql 。

3、使用 Navicat 连接上数据库,执行下面的 SQL 脚本进行表和数据的创建:

CREATE TABLE user_test(user_name varchar(100));
insert into user_test(user_name) values('oec2003')

4、GreenplumDemo 控制台项目添加如下代码:

using System;
using Npgsql;
namespace PostgreSqlDemo
{
    class Program
    {
        static void Main(string[] args)
        {

            var connString = "Host=10.15.3.111;Username=gpadmin;Password=123456;Database=postgres;Port=5432";

            using (var conn = new NpgsqlConnection(connString))
            {
                conn.Open();

                using (var cmd = new NpgsqlCommand("select * from user_test", conn))
                using (var reader = cmd.ExecuteReader())
                    while (reader.Read())
                        Console.WriteLine(reader["
user_name"]);
            }

            Console.ReadKey();
        }
    }
}

只要你会使用 ADO.NET ,那么使用 Npgsql 就不存问题。

希望本文对您有所帮助。

浏览 38
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报